Local Video Creator
标题:
预览/下载
?
横屏
录制
停止
预览
下载视频
关闭
设置
导入设置
导出设置
关闭
基础
音频/TTS
素材与音效
语音识别
录制/导出
DeepSeek Key
DeepSeek提示词
气泡系统提示词
气泡用户提示模板
处理关键词用英文
素材来源
Pexels
Pixabay
Pexels Key
Pixabay Key
素材类型
图片
视频
TTS 引擎
浏览器 TTS
Kokoro TTS
Piper TTS
Edge TTS
配音
🔊 试听
语速
性能诊断
段间隔(ms)
Edge 并发
播放前素材预加载
预加载统计
待命
查看失败项
播放前等待媒体
超时(秒)
人脸检测模型
自动
近景(short)
远景(full)
人脸置信度
轮廓置信度
轮廓线条模式
手动
自动
气泡显示条件
仅识别人脸时
允许无脸主体
气泡需轮廓图
气泡字体
系统默认
Noto Sans SC
苹方(PingFang SC)
微软雅黑(Microsoft YaHei)
冬青黑体(Hiragino Sans GB)
黑体(SimHei)
楷体(KaiTi)
Arial
气泡字号(px)
轮廓线条粗细
推进模式
按声音推进
媒体同步推进
启用实时音效
严格真实模式
视频帧智能检测
自动识别音效
视觉不可用时允许主线程回退
启用文本情绪模型(提示音效)
智能检测阈值
智能检测优先策略
综合
视觉优先
文本优先
启用混响
空间大小
湿度(Wet Mix)
素材音效管理
打开
真实素材库统计
添加禁用词
清空禁用词
素材生成时预合成TTS
素材并发
单个
2个
4个
8个
素材请求间隔(ms)
照片候选数
视频候选数
标签最大数量
ASR 引擎
Vosk
Whisper
ASR 模型
ASR 语言
自动
中文
English
Whisper 模型
tiny
base
Whisper 精度
q8
q4
fp16
fp32
开始识别
停止识别
识别文本
清空
模型ID
设备
WASM
WebGPU
精度
q8
fp32
fp16
q4
q4f16
声音
🔊 试听
下载Kokoro模型
模型ID
设备
WASM
WebGPU
精度
q8
fp32
fp16
q4
q4f16
声音
🔊 试听
下载Piper模型
声音
刷新声音列表
🔊 试听
录制质量
高清(1080p/6Mbps)
中清(720p/3Mbps)
标清(480p/1.5Mbps)
不压缩(原始分辨率)
录制方式
当前录制功能
浏览器屏幕录制(当前标签页)
录制行为
录制时自动播放
录制时自动切换TTS
播放结束自动停录
录制日志
预加载失败项
关闭
暂无失败项
编辑文案
生成
处理
保存
关闭
待命
使用说明
关闭