花了两天的业余时间,看完了Lex Fridman 对 Sam Altman的访谈,2个多小时的视频,信息量非常大,看完之后意犹未尽,觉得很多东西需要多看两遍消化一下。而视频又非常不利于反复会看片段内容。于是就把讲话内容转成了双语epub。具体流程是这样的:

1、在油管下载视频的音频部分,用插件也可以,用https://onlinevideoconverter.com/ 来下也可以。如果和我一样用插件下载的音频是webm格式,就还要再多一步把webm装成mp3.

2、把mp3上传到飞书妙记,会自动把语音转成文件,非常快2个小时的音频,大概5-6分钟就转好了,而且是分说话者的——对,聪明的你应该想到了,这玩意儿是做会议记录的神器。

文字内容非常长,这里就截了个开头。我已经把两个说话者名字输进去了,自动把后面全都匹配了。

3、最后一步,从飞书上把文字下载下来,随便pdf,docx还是txt都可以。用ebook-GPT-translator https://github.com/jesselau76/ebook-GPT-translator把文件翻译成中英文双语,并输出为一个epub。用的gpt3.5模型,效果还不错。感觉比飞书自带的翻译好很多。

整个流程还是比较流畅的。没研究飞书的api,如果能够用一个脚本把整个对接起来会非常爽——之前写的同步翻译的脚本可以用whisper来转录语音,但是whisper转录效果不是很好,速度和准确度都不如飞书妙记。翻译后的文字下载链接,其实这个视频B站有中文字幕版,不过是内嵌字幕不能单独下载。

最后,强烈推荐这个视频,值得反复观看。Sam Altman在视频中表现出的智慧,冷静,克制和理性,在open AI其他人的访谈里面也不断看到过,对这个企业的哲学更加感兴趣了。

UPDATE

用ffmpg来获取视频里的音频文件,不需要安装任何视频编辑软件。然后就可以非常快的拿到视频的文本内容。在此基础上无论是翻译还是根据文本来修改写文章都很方便。以后自己上课和培训的内容可以非常快的变成文字。