Potplayer现在支持直接采用Whisper生成字幕了

roobtheloob

2025-05-05T03:12:06+00:00

[s:ac:茶]3小时的ASMR，以5060ti的CUDA性能都可以在891秒的时间里激光烤肉。
自动对上时间轴，并且是实时生效的，不需要等转换完再看视频，甚至可以在这期间拖动视频时间轴。
单靠CPU也能跑，不过会慢很多。
目前试了一下1小时的在线会议录屏，和3小时的R-18 ASMR录播，分别是英文和日文，识别精度都非常高。

直接打开文件，然后右键→字幕→生成有声字幕→选择引擎Whisper Faster(推荐)→模型Large V2，点击开始即可。
在下载引擎和模型的过程中，需要保证可以访问外网。

如果需要进一步翻译成中文，可以把字幕文件直接拖给GPT或者Deepseek。

简单好用极其容易上手，几乎是0学习成本[s:ac:哭笑]
拿来抓在线会议的纪要、ASMR或者Vtuber直播，简直不要太方便。
[img]https://img.nga.178.com/attachments/mon_202505/14/9aQpzi8-151gK16T1kSfs-3d.png[/img]
[img]https://img.nga.178.com/attachments/mon_202505/14/9aQdfy8-75umZcT3cSl9-aw.jpg[/img]