与亲生子伦中文字幕,国产精品美女久久久久AV爽,人妻夜夜爽天天爽,在线播放无码后入内射少妇

登錄|注冊(cè)數(shù)據(jù)標(biāo)注交流2000人QQ群:489587938客服QQ/微信:670201222

Asr English Phonetic Labeling Course


   英文語音識(shí)別標(biāo)注標(biāo)準(zhǔn)

English speech recognition labeling standard

語音識(shí)別(ASR)指把語音轉(zhuǎn)換成文字。任務(wù)是把音頻中的speech(說話)一字不落的標(biāo)注出來。

Speech recognition (ASR) refers to the conversion of speech into text. The task is to mark out the speech in the audio without dropping a word.

 

1. 登錄小核眾測(cè)官網(wǎng)https://zc.bytedance.com/,點(diǎn)擊更多任務(wù);

Log on to the small nuclear public site https://zc.bytedance.com/, click more tasks;

1.png

2. 搜索ASR并點(diǎn)擊該隊(duì)列,點(diǎn)擊開始任務(wù);

Search for ASR and click the queue, click start task;

 12.png

122.png 

 

3. 標(biāo)注流程:

Annotation process:

14.png 

4. 語音類型判斷標(biāo)準(zhǔn):

Speech type criteria:

1) speech可聽清的人說話聲,若視頻中有多人說話,需要都寫出來;若音頻中有部分時(shí)段多人說話聲重疊,且很清晰,需要把重疊部分截掉(rap:節(jié)奏感不是很強(qiáng)的,也可以標(biāo)注。

Speech: can hear the sound of people talking, if there are many people in the video speak, need to write it; If there are parts of the audio with multiple voices overlapping and clear, the overlapping parts need to be cut off (rap: rhythm is not very strong, can also be tagged.)

2) speech音樂、唱歌 、動(dòng)物叫聲和自然界的聲音

Non-speech: music, singing, animal calls and natural sounds

3) 丟棄英語除外的其他語種、聽不清、嘈雜聲

Discarded: other languages other than English, inaudible, noisy

 

5. 文本書寫標(biāo)準(zhǔn):

Text writing standards:

1) 不加標(biāo)點(diǎn)符號(hào),單詞間需加空格

Without punctuation, spaces should be added between words

2) 專有名詞、人名、電影名、書名 每個(gè)單詞首字母大寫;縮略語每個(gè)字母都需大寫,其余都小寫(包括句子首字母第一個(gè)單詞)

Proper nouns, personal names, movie names, book titles, each word is capitalized; acronyms are capitalized for each letter, and the rest are lowercase (including the first word in a sentence)

3) 數(shù)字不要寫阿拉伯?dāng)?shù)字,比如,59--fifty-nine

Numbers don't write Arabic numerals, for example, 59--fifty-nine

4) 若單詞發(fā)一半,可以不寫

If the word is half pronounced, you can leave it

5) 正常按照音頻發(fā)音標(biāo)注,若用戶發(fā)音錯(cuò)誤,需要按正確的標(biāo)注出來

Note normally according to the audio pronunciation, if the user pronunciation is wrong, it is necessary to mark it correctly

6) 郵箱和網(wǎng)址按照正常形式輸出,比如:www.yahoo.com

Mailboxes and URLs are exported in normal form, such as: www.yahoo.com

 

6. 截取操作

Interception operation

1) 需要截取的情況:句首或句尾有聽不清的語音、嘈雜音、靜音、多人說話重疊等需截掉

Situations where interception is required: inaudible sounds, noise, mute, overlapping of speech, etc., at the beginning or end of a sentence

2) 截取方式:可通過點(diǎn)擊【截取開始】和【截取結(jié)束】選定截取區(qū)間(或者對(duì)應(yīng)的快捷鍵),然后點(diǎn)擊【截取確認(rèn)】(或者使用快捷鍵a或5),此時(shí)區(qū)間內(nèi)的語音將自動(dòng)播放,表示截取完成

Interception: select the intercept interval (or the corresponding shortcut key) by clicking on [intercept start] and [intercept end], and then click [intercept confirmation] (or use shortcut key a or 5), where the voice within the interval will be played automatically, Indicates completion of interception

3) 截取技巧:拖動(dòng)小紅點(diǎn)進(jìn)行截取區(qū)間修改,點(diǎn)擊上方波形圖可顯示小紅點(diǎn)

Interception technique: drag small red dot to modify the intercept interval, click on the above waveform to display the small red spot

4) 注意 截取后要確認(rèn)一下語音和文本是否對(duì)應(yīng)

Note: after intercepting, verify that the speech and text correspond

5) 必須在原截取區(qū)間內(nèi)截取,比如原語音的播放區(qū)間為3-8s,只能在3-8s內(nèi)截取,不可截長(zhǎng)至1-8s

Must be intercepted within the original intercept interval, for example, the playback interval of the original speech is 3-8s, can only be intercepted within 3-8s and cannot be cut to 1-8s

 

7. 快捷鍵

1) 空格-提交Spaces-submission

2) 1-開始1-start

3) 2-暫停2-suspension

4) 5-重復(fù)播放截取區(qū)間5- repeat play intercept interval

5) q-丟棄Q-discard

6) w-非speechW-non-speech

7) s-截取開始S- start of interception

8) e-截取結(jié)束E- end of interception

9) a-截取確認(rèn)A-intercept confirmation

10) shift+alt-文本切換Shift alt- text switching

7. 部分技巧

Partial technique

1) 多使用快捷鍵Use shortcuts more often

2) 可以先理解視頻大概意思再標(biāo)注

You can understand the general meaning of the video and then annotate it.

3) 可以根據(jù)意群,標(biāo)注

Can be tagged according to the meaning group

4) 對(duì)一些出現(xiàn)率高的視頻語音進(jìn)行文本整理,可直接粘貼復(fù)用

Text finishing for some video voice with high frequency, which can be directly pasted and multiplexed


推薦文章

愛數(shù)語音標(biāo)注登陸網(wǎng)址babel.magicdatatech.com/processmore/index.php用谷歌瀏覽器,鼠標(biāo)拖動(dòng)截取分段,內(nèi)容右鍵,選擇符號(hào)愛數(shù)這個(gè)任務(wù)非常簡(jiǎn)單,很好做,需要的看下文檔1、需要根據(jù)說話人變化切換說話人,角色根據(jù)出場(chǎng)前后順序標(biāo)注2、根據(jù)說話人內(nèi)容進(jìn)行轉(zhuǎn)寫,不得漏字、錯(cuò)字、多字3、嚴(yán)重方言允許舍棄,帶口音的普通話請(qǐng)盡量轉(zhuǎn)寫。4、在說話人說話的過程中,如果背景中有噪音,則需標(biāo)注噪音符號(hào),音樂早已標(biāo)注MUSIC、其他人聲噪音標(biāo)注NOISE。5、如果兩個(gè)說話人同時(shí)說話的,允許丟棄兩個(gè)人同時(shí)說話的部分,但一個(gè)人說話的地方請(qǐng)保留。 (不要斷句太散,如果句子中有一個(gè)字聽不懂的,請(qǐng)聯(lián)系前后語境,推測(cè)出最可能的字,盡量整句標(biāo)注)一、開始標(biāo)注語音文件一 時(shí)間邊界定位:? 用鼠標(biāo)選中波形,即為要標(biāo)注的一段時(shí)間邊界,此時(shí)會(huì)自動(dòng)跳出對(duì)應(yīng)的編輯框 圖中的紅藍(lán)方框即為選中一段需要標(biāo)注的時(shí)間邊界。? 聽音,在整段電話語音的基礎(chǔ)上,根據(jù)語義和停頓時(shí)間等因素,在音頻信號(hào)中每一句話的句首和句尾分別添加時(shí)間邊界。即,一段標(biāo)注框內(nèi),即為一段標(biāo)注的話。? 每段前后需預(yù)留0.3s的空白段,但在沒有可預(yù)留空白的情況下,不做預(yù)留,同理,疊加也不做預(yù)留,僅是說話段、并且能有前后留白的地方預(yù)留0.3s。二 文件標(biāo)注:? ? 此處主要標(biāo)注語音文件的一些全局信息,包括說話人性別信息和語種信息(方言區(qū))。標(biāo)注時(shí)請(qǐng)按照實(shí)際情況選擇。? 關(guān)于說話人的選擇,客服標(biāo)注奇數(shù),用戶標(biāo)注偶數(shù);? 如果第三個(gè)人的情況:點(diǎn)擊“+”號(hào),即可添加。? 編輯框內(nèi)需要標(biāo)注的是該句對(duì)應(yīng)的文字? 如果是漢語交談,則只能用簡(jiǎn)體漢字。對(duì)于語音中的數(shù)字部分需根據(jù)發(fā)音情況轉(zhuǎn)換為對(duì)應(yīng)的漢字,例如“27”→“二十七”;“我的電話是2381832”→“我的電話是二三八幺八三二(與發(fā)音相同)”。? 編輯框內(nèi)正常語音的標(biāo)注? 如果此語段為某一個(gè)人的漢語對(duì)話語音,請(qǐng)?jiān)跇?biāo)注時(shí)間邊界后,選擇對(duì)應(yīng)的1或者2,編輯框內(nèi)輸入相應(yīng)的文本。? 如果此語段為兩個(gè)人交叉語音,關(guān)于重疊(交叉)的語音,即對(duì)于某個(gè)人的一句話未完,另一個(gè)人的一句話已經(jīng)開始的情況:請(qǐng)不要標(biāo)注該語段,空置就行。? 在整個(gè)語音中,需根據(jù)說話人的變換來增加時(shí)間邊界(不同說話人分段標(biāo)注)。? 如果同一說話人說話時(shí)間較長(zhǎng),則應(yīng)根據(jù)其語義來增加時(shí)間邊界,每個(gè)時(shí)間段的長(zhǎng)度最多不能超過8s,但斷句也不要太散太短。根據(jù)標(biāo)注經(jīng)驗(yàn),每個(gè)自然語言段平均在5-6秒左右即可。? 單字或者兩個(gè)字的疊加(如:好,嗯,行,好的),聲音較小,不影響主要說話人內(nèi)容,那么可以不標(biāo)疊加,直接寫主要說話人的內(nèi)容就行了。在說話人說話的過程中,如果背景中有噪音,則需標(biāo)注噪音符號(hào),音樂早已標(biāo)注MUSIC、其他人聲噪音標(biāo)注NOISE。如:我們是最好的朋友NOISE在背景是人發(fā)出的噪音的情況標(biāo)注NOISE,整條有電流聲或非人聲的底噪不用加NOISE 比如說話的同時(shí)有另一個(gè)人咳嗽聲和語音重疊了就標(biāo)NOISE如果主說話人的聲音重疊了舍棄 ? 英文:(英文都是小寫)只有符號(hào)英文是大寫!【單詞】對(duì)于語音中簡(jiǎn)單的英文單詞,在能聽懂的情況下,直接標(biāo)出即可。例如:“網(wǎng)址是三w點(diǎn)sina點(diǎn)com”;“二三八幺八三二at qq點(diǎn)com”(不要寫這個(gè)@)“請(qǐng)以井號(hào)鍵結(jié)束”;(不要寫這個(gè)#) 【字母】每個(gè)字母中間用空格隔開。例如:?jiǎn)卧~讀音,g o o d則表示字母讀音;例如:我的編號(hào)是f m s幺三二;? 語氣詞除了“誒”其他的語氣詞都是帶口字旁的漢字標(biāo)注。如果發(fā)音是表示應(yīng)答的“嗯”,統(tǒng)一都用“嗯”,不要用“恩”或者“厄”。比如哦,啊,誒等.除[G]表示整句舍棄外,其他無任何符號(hào),遇到噪音,直接空置,不標(biāo)注即可。如遇到系統(tǒng)播報(bào)音,請(qǐng)用此方式標(biāo)注,歡迎致電中國(guó)保險(xiǎn)TTS標(biāo)注10分鐘請(qǐng)點(diǎn)擊一次臨時(shí)保存,并刷新網(wǎng)頁!如果停頓有0.5秒了,前后語音就要斷開截取關(guān)于噪音:1、 一個(gè)人說了一句話,是連續(xù)沒有停頓的,但一半有需要標(biāo)噪音符號(hào)的一半不需要標(biāo)噪音符號(hào)的,合一條截取且標(biāo)噪音符號(hào)2、 若突發(fā)噪音與語音很近的話,不能截取突發(fā)噪音,從突發(fā)噪音后面開始截取,如果是底噪的話就可以正常前后預(yù)留了,如下圖,紅框里的是一個(gè)咳嗽聲,這種情況下就不要0.3秒的預(yù)留了,咳嗽聲切出去 3、 如果主說話人與旁聽人員的語音重疊了,主說話的聲音很大,旁聽人的聲音特別小的,就是有人在旁邊一直小聲的說話這樣的當(dāng)做背景人聲,這屬于環(huán)境背景人聲,加NOISE原文件下載magic-talking標(biāo)注規(guī)范-20180321.docx

熱門文章

滴滴語音標(biāo)注規(guī)則要求及視頻教程
一、標(biāo)注環(huán)境1. 請(qǐng)使用谷歌瀏覽器進(jìn)行標(biāo)注。2.標(biāo)注平臺(tái)地址:http://label.xiaojukeji.com/labelerTaskList二、標(biāo)注內(nèi)容1. 語音有效性標(biāo)注無效語音請(qǐng)?jiān)谟行砸豁?xiàng)選擇“無效”,并在標(biāo)注文本一項(xiàng)標(biāo)注大寫字母“NULL”。有效語音請(qǐng)?jiān)谟行砸豁?xiàng)選擇“有效”。當(dāng)語音出現(xiàn)下列任意一種情況,即可標(biāo)注為無效語音:1) 說話人聲音極小,小到幾乎聽不到。2) 整段語音均為靜音。3) 整段語音均為噪聲、音樂聲、導(dǎo)航音、廣播等。4) 整段語音只有一個(gè)字,或是同一個(gè)字重復(fù)出現(xiàn)。如:“嗯”、“對(duì)”、“對(duì)對(duì)對(duì)對(duì)”、“啊”、“喂”、“拜拜”、“謝謝”、“好好好”、“OKOK”等。(注意:“哇噻”屬于特例,單獨(dú)出現(xiàn)時(shí)也是無效的。)5) 背景噪聲大于說話人聲音,或噪聲與說話人聲音幾乎一樣大。6) 整句都是方言、外語。方言是指發(fā)音與普通話區(qū)別較大的地方話,如:粵語、上海話等。7) 語音中出現(xiàn)地點(diǎn)、地名、街道名等方位詞,但是地圖中搜索不到。8) 語音中有大于等于兩個(gè)人說話,除主說話人以外,其余人的聲音清晰可辨。9) 語音中有大于等于3個(gè)字聽不清楚。 2. 語音文本標(biāo)注1) 語音文本內(nèi)容將說話內(nèi)容寫成文字。要求轉(zhuǎn)寫的文本內(nèi)容必須和聽到的語音完全一致,不能多字、少字。a) 除空格、占位符號(hào)、以外,標(biāo)注文本不允許使用標(biāo)點(diǎn)符號(hào),不允許換行。b) 說話人猶豫、口吃導(dǎo)致出現(xiàn)重復(fù)的字也要標(biāo)注出來,重復(fù)了幾次就標(biāo)記幾個(gè)。如發(fā)音為:我是北北京人;“北”字有重復(fù)現(xiàn)象。轉(zhuǎn)寫文本應(yīng)為:我是北北京人c) 兒化音不需要標(biāo)注出“兒”字。如發(fā)音為:我在/zher4/。轉(zhuǎn)寫文本應(yīng)為:我在這d) 語音中提及地名、街道名、車牌號(hào)等內(nèi)容,轉(zhuǎn)寫時(shí)需符合日常習(xí)慣。選用“路”、“街道”、“門”、“座”、“橋”等地名常用字以及“京”、“津”、“冀”等車牌號(hào)常用字。e) 語音中提及地名、街道名、店鋪名、專有名詞,需要準(zhǔn)確轉(zhuǎn)寫。可根據(jù)讀音在地圖中查找,確實(shí)存在該地點(diǎn)則進(jìn)行準(zhǔn)確標(biāo)注,搜不到則無效;f) 語音中確實(shí)聽不清楚的個(gè)別單字,用占位符號(hào)【~】標(biāo)記。一組【~】符號(hào)代表一個(gè)字。在整段語音中,最多只能有兩組【~】符號(hào)。若有三個(gè)字或更多聽不清楚,則標(biāo)注為無效。(見“語音有效性標(biāo)注”第8條)g) 語音中不涉及地名、專名的部分,若發(fā)音清晰但文字不確定,可以用同音字標(biāo)注,要求標(biāo)注用字的聲韻調(diào)與實(shí)際發(fā)音完全一致。如發(fā)音為:我姓/zhang1/。標(biāo)注成“我姓張”或“我姓章”都算正確。h) 數(shù)字要寫成漢字形式,注意區(qū)分“一”和“幺”、“二”和“兩”,按實(shí)際讀音寫。i) 英文字母要轉(zhuǎn)寫成大寫字母。j) 音頻中說話人清楚說出的語氣詞,如“呃、啊、嗯、哦、唉、吶、呢”等,要按照正確發(fā)音進(jìn)行轉(zhuǎn)寫。語氣詞除了“了、不”沒有口字旁,其他基本上都有口字旁。注意:語氣詞“唉”、“誒”不分的,統(tǒng)一用“唉”。 3.語言情況標(biāo)注1)語音中全部?jī)?nèi)容均為中文,請(qǐng)選擇“中文”。2)只要語音中含有英文,不論是單個(gè)字母還是單詞、不論出現(xiàn)的數(shù)量有多少,都需要選擇“英文”并且字母全部大寫。1、遇到英文單詞和英文字母都需要用英文大寫形式表現(xiàn)。例如:SORRY SORRY我現(xiàn)在在阜成路麻煩你掉個(gè)頭2、單詞與單詞之間加空格 。例如:我把我的APPLE SEVEN PLUS落在了車上麻煩師傅還給我一下3、字母與字母之間加空格。例如:我下了好幾回這個(gè)A P P了但是怎么安裝都是失敗的請(qǐng)問客服我該怎么辦4、英文單詞或者英文字母與漢字之間不需要空格。例如:我的車牌號(hào)的京A三六七八5、特殊字:對(duì)于OK這一類常用詞,默認(rèn)為一個(gè)單詞,盡管是拼讀成字母發(fā)音的。對(duì)于無從適配上述規(guī)則的及時(shí)與我們溝通 4. 說話人性別標(biāo)注按說話人的音色實(shí)際情況進(jìn)行標(biāo)注。若無法明確區(qū)分男女,不論是成人還是兒童,都標(biāo)注為“女”。三、標(biāo)注常見問題總結(jié)1. 短句如何判斷有效性?答:短句只要有大于或等于兩個(gè)不重復(fù)的音節(jié),即為有效。例如“嗯好的”、“明白”、“可以”等。 2. 有明顯口音,但能聽懂,需要標(biāo)注嗎?答:口音但不影響理解的,音頻中個(gè)別幾個(gè)字的方言可以使用同音字標(biāo)注。聽不清音節(jié)的方言也無法使用同音字標(biāo)注的,可以使用【~】,大于或等于三個(gè)字需使用【~】符號(hào)的情況下。參照“語音有效性標(biāo)注”第8條規(guī)則,標(biāo)記為無效。 3. 標(biāo)注時(shí)有的口音能聽懂,是按聽的音來標(biāo)注還是按普通話來標(biāo)注,標(biāo)注需要符合現(xiàn)實(shí)邏輯嗎?答:一般情況下口音按實(shí)際發(fā)音來標(biāo)注。以下情況請(qǐng)?zhí)貏e處理:常用詞語和專有名詞需按現(xiàn)實(shí)邏輯標(biāo)注(如:發(fā)音是“現(xiàn)/xian4/生”標(biāo)為“先生”,“滴滴專/ce1/”標(biāo)為“滴滴專車”等等) 5. 音頻中一串?dāng)?shù)字如【12531】轉(zhuǎn)寫為一二五三一還是吆二五三吆?答:轉(zhuǎn)寫的文本要和語音實(shí)際讀法完全一致。若讀為yi1,則寫一;讀為yao1,則寫幺。同理,“二”、“兩”、“倆”;“三”、“仨”也需要區(qū)別使用。 6. 一段很短的音頻中語速過快,有時(shí)候聽起來像三個(gè)字又像兩個(gè),是不是都能判斷合格?答:短音頻且內(nèi)容無法聽清的情況下,標(biāo)記為無效。長(zhǎng)音頻中很小的一部分,無法確定內(nèi)容時(shí),參照“語音文本內(nèi)容”下f項(xiàng)、【~】符號(hào)使用規(guī)則進(jìn)行。 7. 一段音頻中語速過快,能聽清某些音節(jié)但大多部分不能做出準(zhǔn)確判斷寫不出是否可以判斷無效?答:判斷為無效 8. 一段音頻中出現(xiàn)導(dǎo)航儀發(fā)出的聲音或者只有導(dǎo)航儀的聲音算噪音嗎?答:整段只有導(dǎo)航音,標(biāo)記為無效。只有一部分出現(xiàn)導(dǎo)航音的時(shí)候,看聲音大小,如果與說話人音量接近或者大于說話人聲音,標(biāo)記為無效。 注意:如果一句話里面只說了幾個(gè)字方言,其他都是帶口音的普通話,不要直接標(biāo)無效,那全方言的字按聽到的音來標(biāo),比如:說的是上海話gege,就標(biāo)成“葛個(gè)”,而不是標(biāo)成“那個(gè)”。語氣詞無法轉(zhuǎn)寫的可以找同音字或相近音字轉(zhuǎn)寫;全方言無效 關(guān)于地點(diǎn)、地名、街道名等方位詞,這些詞我們需要使用地圖搜索引擎搜索如果地點(diǎn)、地名、街道名等詞語很長(zhǎng)且詞發(fā)音很清晰,但使用地圖搜索引擎搜索不到這個(gè)地點(diǎn)。即使這句話其他部分可以完整的轉(zhuǎn)寫出來,但依舊視為無效。二、關(guān)于英文轉(zhuǎn)寫原規(guī)范為:英文字母要轉(zhuǎn)寫成大寫字母。        細(xì)化:1、遇到英文單詞和英文字母都需要用英文大寫形式表現(xiàn)。例如:SORRY SORRY我現(xiàn)在在阜成路麻煩你掉個(gè)頭2、單詞與單詞之間加空格 。例如:我把我的APPLE SEVEN PLUS落在了車上麻煩師傅還給我一下3、字母與字母之間加空格。例如:我下了好幾回這個(gè)A P P了但是怎么安裝都是失敗的請(qǐng)問客服我該怎么辦4、英文單詞或者英文字母與漢字之間不需要空格。例如:我的車牌號(hào)的京A三六七八5、特殊字:對(duì)于 OK 這一類常用詞,默認(rèn)為一個(gè)單詞,盡管是拼讀成字母發(fā)音的。對(duì)于無從適配上述規(guī)則的,我們及時(shí)向海瑞提出。三、噪音符號(hào)這部分,這部分依舊不用添加。 四、關(guān)于標(biāo)普、方普、方言如何轉(zhuǎn)寫    1、標(biāo)普:就是普通話,我們是一定要轉(zhuǎn)寫的。    2、方普:就是方言普通話,例如廣州人說普通話,上海人說普通話,天津人說普通話等等,這些是需要轉(zhuǎn)寫的。只是他們?cè)谡f普通話的時(shí)候會(huì)有一些口音。例如發(fā)音說:我現(xiàn)在湖南(fu2聲 lan2聲)長(zhǎng)沙市中心你來接我一下     他說的是“fu lan”我們正常書寫成“湖南”即可。    3、方言:直接視為無效即可,例如:粵語、上海話、江蘇話等等。