roobtheloob
2025-05-05T03:12:06+00:00
[s:ac:茶]3小时的ASMR,以5060ti的CUDA性能都可以在891秒的时间里激光烤肉。
自动对上时间轴,并且是实时生效的,不需要等转换完再看视频,甚至可以在这期间拖动视频时间轴。
单靠CPU也能跑,不过会慢很多。
目前试了一下1小时的在线会议录屏,和3小时的R-18 ASMR录播,分别是英文和日文,识别精度都非常高。
直接打开文件,然后右键→字幕→生成有声字幕→选择引擎Whisper Faster(推荐)→模型Large V2,点击开始即可。
在下载引擎和模型的过程中,需要保证可以访问外网。
如果需要进一步翻译成中文,可以把字幕文件直接拖给GPT或者Deepseek。
简单好用极其容易上手,几乎是0学习成本[s:ac:哭笑]
拿来抓在线会议的纪要、ASMR或者Vtuber直播,简直不要太方便。
[img]https://img.nga.178.com/attachments/mon_202505/14/9aQpzi8-151gK16T1kSfs-3d.png[/img]
[img]https://img.nga.178.com/attachments/mon_202505/14/9aQdfy8-75umZcT3cSl9-aw.jpg[/img]
自动对上时间轴,并且是实时生效的,不需要等转换完再看视频,甚至可以在这期间拖动视频时间轴。
单靠CPU也能跑,不过会慢很多。
目前试了一下1小时的在线会议录屏,和3小时的R-18 ASMR录播,分别是英文和日文,识别精度都非常高。
直接打开文件,然后右键→字幕→生成有声字幕→选择引擎Whisper Faster(推荐)→模型Large V2,点击开始即可。
在下载引擎和模型的过程中,需要保证可以访问外网。
如果需要进一步翻译成中文,可以把字幕文件直接拖给GPT或者Deepseek。
简单好用极其容易上手,几乎是0学习成本[s:ac:哭笑]
拿来抓在线会议的纪要、ASMR或者Vtuber直播,简直不要太方便。
[img]https://img.nga.178.com/attachments/mon_202505/14/9aQpzi8-151gK16T1kSfs-3d.png[/img]
[img]https://img.nga.178.com/attachments/mon_202505/14/9aQdfy8-75umZcT3cSl9-aw.jpg[/img]