关闭广告

媒体播放器通用框架 FFmpeg 推出 AI 语音识别功能

IT之家2025-08-14 00:00:014121人阅读

IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。


该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON

该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。


IT之家注意到,该工具还支持 GPU 加速,可以显著加快转写过程。对于用户来说,这一功能取代了对外部、多步骤转写过程的需求,将任务整合到一个高效的单命令行工作流程中。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“旺仔小乔”被曝用替身,疑存在多人分工模式

观察鉴娱 浏览 8437 07-31

女子称在珠海丢失40万卡地亚手镯 监控显示疑被捡走

极目新闻 浏览 7452 08-16

官方:切尔西19岁前锋杰伊-摩根租借至英甲彼得堡联 租期一个赛季

直播吧 浏览 64 09-02

伊姐周日热推:综艺《向往的生活-戏如人生》;电视剧《狸猫书生第二季》......

伊周潮流 浏览 56 10-13

用筷子练出“机械臂”,成都95后女飞手完成无人直升机实弹靶试

红星新闻 浏览 7164 07-20

李强总理访朝系2009年以来中国总理首次访朝 中方回应

澎湃新闻 浏览 96 10-10

阿里巴巴:斑马股份拟于香港联交所主板独立上市;泡泡玛特王宁:本周将发布迷你版LABUBU|早资道

封面新闻 浏览 87 08-21

哈梅内伊:美国煽动策划伊朗骚乱

每日经济新闻 浏览 8 01-19

全新岚图知音8月底正式上市,配置基本封顶,预售价22万起

SUV大百科 浏览 732 08-15

河南“猪王”半年大赚超105亿!牧原股份:年底能繁母猪再减13万头

时代周报 浏览 63 08-22

乌无人机频繁突袭俄腹地 分析称或在俄境内组装发射

北青网-北京青年报 浏览 5781 07-07

特朗普:一支舰队正在向伊朗方向航行

界面新闻 浏览 2 01-28

2025年中国10大电摩厂商销量:雅迪92万辆,春风极核第5,隆鑫第9

小鹏财经 浏览 8 01-21

破局“影子AI”!神州控股科捷小金Agent,打造行业供应链专家

野马财经 浏览 58 10-11

蜜雪冰城开到公交站乘车享折扣 执法局的人却上门了

每日经济新闻 浏览 42 12-05

20多斤一个的冬瓜因为能降温火了 菜场摊主:没有现货

都市快报橙柿互动 浏览 9147 07-14

港E声|一文看懂港交所ESG监管进阶:从“管披露”到“管能力”螺旋升级

时代周报 浏览 1800 07-30

834只偏股基金净值创新高!

一地基毛 浏览 7978 08-19

宋茜陈梦逛街被偶遇,两人聊的特别开心

陈意小可爱 浏览 5236 07-21

马筱梅被夸情绪稳定,汪小菲改变超明显

甜柠檬吖 浏览 9369 08-12

吴尊元旦晒全家福!一家四口笑容灿烂温馨幸福

失宠的小野猪 浏览 16 01-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3