1. 應用戶倡議,開辟音頻轉(zhuǎn)錄字幕功能,按音頻時長(秒)計費,可通過點數(shù)兌換轉(zhuǎn)錄時長(1點=120秒);
2. 由于視頻文件過大,僅支持上傳音頻文件,主流格式都支持,推薦使用本站出品的批量視頻轉(zhuǎn)音頻工具;
3. 本站接入多個轉(zhuǎn)錄模型,由于各模型擅長語種不同,故會根據(jù)源語言自動推薦最佳的模型;
4. 不同轉(zhuǎn)錄模型的價格、速度、特性各不同,具體請看頁面下方的【轉(zhuǎn)錄模型比較】表格;
5. 為方便用戶,每個轉(zhuǎn)錄訂單會同時提供srt字幕文件、txt文本文件,并同時提供多個【標點符號】版本;
6. 日語、韓語推薦豆包模型(識別準,智能斷句);其他模型識別質(zhì)量可以,但斷句處理可能不佳,容易出現(xiàn)某些行句子過長;
7. 對于執(zhí)行失敗的訂單,系統(tǒng)會自動退返『轉(zhuǎn)錄時長』。客服QQ:2801088826
請先選擇源語言:
- 消耗轉(zhuǎn)錄時長: 0秒 (賬戶轉(zhuǎn)錄時長:0秒)
- 人民幣計費約0元
-
標點符號:
完整去尾無 -
語氣詞過濾:
臟詞過濾:
-
智能格式化:
-
說話人分類:
-
熱詞:
幫 助 說 明
計費方式:
○ 按音頻時長(秒)計費,可通過點數(shù)兌換轉(zhuǎn)錄時長(1點數(shù)=120秒)
補充說明
① 推薦上傳wav音頻格式(建議16K采樣率,過大采樣會導致文件過大),該格式無損,識別效果好(【推薦下載】批量視頻轉(zhuǎn)音頻工具)
② 上傳音頻文件最大1GB,保留3天后自動刪除
③ 每個訂單會同時提供srt字幕文件、txt文本文件;
④ 每個訂單會額外提供不同【標點符號】版本srt文件(完整、去尾、無),字母語言會額外提供【完整斷句】版本srt文件;
⑤ 不同模型會有自己的特有參數(shù),具體在選擇模型后可以看到;
⑥ 支持AI智能斷句的模型:Whisper(字母語言)、Nova-2(字母語言)、Assem(字母語言);
⑥ 支持智能斷句的模型:騰訊(中文)、豆包(中日韓);
⑦ 支持多個源語言的模型:[騰訊]普方英、[騰訊]中英粵,默認識別出來的是對應的源語言,而不是統(tǒng)一的某個語言(可使用本站的谷歌/AI接口翻譯成統(tǒng)一語言);
⑧ 支持說話人分類標記的模型:Nova-2(全語種)、豆包(全語種)、Assem模型;
⑨ 部分模型支持填寫熱詞,以提高識別準確度,最多可填寫100個詞匯,使用英文逗號,分割,可以填寫對應源語言,文字、單詞、帶空格的短語都支持;
⑩ 可以使用【字幕文件預處理】的[轉(zhuǎn)錄糾錯]模式,對轉(zhuǎn)錄后的字幕文件進行單詞糾錯、去幻覺等處理。
轉(zhuǎn)錄模型比較
| 模型 | 定價 | 速度 | 時長上限 | 支持語言 | 特點 |
|---|---|---|---|---|---|
[Assem] Universal ![]() |
基礎時長*1.5 | 極快 | 5小時 | 主流語言14種 | 擅長字母語言,識別精準,AI智能斷句,速度快 |
Nova-2/3 ![]() |
基礎時長*1 | 極快 | 5小時 | 主流語言31種 | 擅長字母語言,字母語言AI智能斷句,速度快 缺點:非字母語言斷句可能有瑕疵 |
豆包 ![]() |
基礎時長*1.3 | 極快 | 5小時 | 中日韓 | 中日韓識別首選,智能斷句,速度快 |
[Assem] Nano ![]() |
基礎時長*0.6 | 極快 | 5小時 | 主流語言53種 | 擅長字母語言,Universal經(jīng)濟版,AI智能斷句,速度快 |
| [騰訊]普方英 | 基礎時長*1.3 | 極快 | 5小時 | 普通話+方言+英語 | 普通話+方言+英語識別首選 缺點:識別結(jié)果語言不統(tǒng)一 |
| 騰訊系列 | 基礎時長*0.8 | 極快 | 5小時 | 普通話、方言等 | 中文識別首選,智能斷句,速度快 缺點:多語種識別結(jié)果語言不統(tǒng)一 |
| Whisper-large-v3 | 基礎時長*0.4 | 一般 | 2小時 | 主流語言56種 | whisper原版最強型號,各語種都比較擅長,字母語言AI智能斷句 缺點:存在輕微幻覺、速度一般、夜間容易超時 |
備注:Nova-2、Nova-3模型價格一樣,支持語種不一樣。Nova-3是Nova-2的升級版,準確率更高,更擅長處理背景嘈雜的音頻。Nova-3模型已支持語種:英語、法語、德語、西班牙語、葡萄牙語、荷蘭語、瑞士語、丹麥語(以上語種選擇Nova模型時,會自動切換到Nova-3模型,其他其他語種仍使用Nova-2模型)
-
支持多個轉(zhuǎn)錄模型
本站經(jīng)多輪測試、精挑細選的轉(zhuǎn)錄模型,具有高質(zhì)量與高性價比
-
根據(jù)源語言推薦模型
系統(tǒng)根據(jù)源語言智能推薦最佳的轉(zhuǎn)錄模型,省時省力
-
提供多版本文件下載
每個訂單提供srt、txt格式文件,srt文件提供2-3種標點符號版本
-
按時長計費 全網(wǎng)最低價
市場普遍0.2-0.3元/分鐘,本站低至0.007元/分鐘;單次充值越多,優(yōu)惠越大
-
支持56種主流語言
支持各種主流語言,漢語方言,支持多語種識別
-
后期AI智能斷句處理
對部分質(zhì)量高、但默認斷句不佳的模型,后期進行AI智能斷句處理,如Whisper、Nova-2、Assem等
-
異步處理 快速出結(jié)果
后臺異步處理,可以同時多開幾個訂單;所有模型基本10分鐘內(nèi)出結(jié)果
-
音頻預處理 提高轉(zhuǎn)錄質(zhì)量
采樣率統(tǒng)一轉(zhuǎn)為16khz,也可開啟智能降噪(人聲分離),提高轉(zhuǎn)錄質(zhì)量
1. 關閉當前窗口后,你可以繼續(xù)針對【當前音頻文件】發(fā)起新的訂單;
2. 點擊按鈕中的"?",可以下載額外的【標點或斷句版本】文件;
3. 本次訂單號為:,你也可以在【網(wǎng)站導航處】輸入訂單號查詢并下載;
4. 注冊用戶可以隨時到【用戶中心】-【轉(zhuǎn)錄訂單】查看訂單信息、下載地址。
4. 對轉(zhuǎn)錄結(jié)果不滿意?可申請退款。 申請退款
已加入后臺任務,可關閉本頁面,稍后到【轉(zhuǎn)錄訂單】查看詳情
說明:不同模型耗時不同,具體耗時可參考等待時間



