shortA-轉(zhuǎn)寫規(guī)范及標(biāo)準(zhǔn)
一、介紹
1. 使用谷歌瀏覽器,判斷有效無效、選擇屬性、轉(zhuǎn)寫文本,需要貼著截取不需要預(yù)留。
a) 地址:http://123.56.137.109:5600/
b) 賬號(hào):LY-shortA
c) 任務(wù):shortA-李靜
2. 登錄成功后,同意保密協(xié)議,就進(jìn)入工作頁面開始工作;
1) 判斷聲音是否有效:
有效:普通話/不標(biāo)準(zhǔn)的普通話,語音是標(biāo)注中需要處理的有效語音
無效:典型舉例如下(視具體音頻隨時(shí)補(bǔ)充無效原因)人工合成的聲音無效唱歌無效
n 無法聽清音頻中的內(nèi)容,噪音過大,分辨不了文本內(nèi)容
n 方言,如:粵語、上海話、閩南語等,非漢語的發(fā)音如日語
n 兩人說話,可以分清主要說話人,把另一人聲音作為背景音,正常轉(zhuǎn)寫主要說話人,需要無效情況如下:
u 重疊了,分不清主次,無效
u 都聽不清不確定說的是什么,無效
u 多人說話一前一后的對(duì)話,無效
n 無人說話;整條音頻只有一個(gè)字的無效
n 音頻中全部都是歌曲、電視聲等人工合成的電子音
n 一半人工合成的電子音,一半人的發(fā)音。整條無效
n 一句話中有2個(gè)或者以上的字聽不懂無效
2) 性別:男|女(如果出現(xiàn)無法辨別的中性聲音,標(biāo)注為女)
3) 口音:有|無(有:每個(gè)字發(fā)音都不標(biāo)準(zhǔn)。無:個(gè)別字不分平翹舌,個(gè)別字音不準(zhǔn)不算口音)
4) 兒童:是|否(明顯兒童,奶聲奶氣幼兒和明顯的10歲以下青少年的稚嫩的聲音)
5) 文本:分包后是按照音頻時(shí)長排句子號(hào)的,所以會(huì)有連續(xù)相同的句子發(fā)音文本一致的情況,直接從前一句復(fù)制到下一句即可(連續(xù)多句的文本相同不是問題的句子是正常的)
快捷鍵:
無效:Alt+1;男Alt+2;女Alt+3;有口音Alt+4;無口音Alt+5;是兒童Alt+6;否Alt+7
二、文本標(biāo)注規(guī)范及標(biāo)準(zhǔn)
1. 轉(zhuǎn)寫內(nèi)容與實(shí)際發(fā)音內(nèi)容一致,對(duì)于因?yàn)榭谝艋蛘邆€(gè)人習(xí)慣導(dǎo)致的音變,仍按照原內(nèi)容轉(zhuǎn)寫。Liu2奶→寫牛奶;轉(zhuǎn)寫內(nèi)容的完整性要與實(shí)際發(fā)音一致。輕微口音不改字
2. 標(biāo)點(diǎn):不加標(biāo)點(diǎn),可以寫i’m ,don’t @轉(zhuǎn)寫為at
3. 數(shù)字寫法:按照數(shù)字的漢字寫法寫成“一二三…”形式,而不是“123”更不能是“壹貳叁”;注意: 讀yao1寫幺,讀lia3寫倆,讀liang3寫兩,讀1.5*1.8寫一點(diǎn)五乘以一點(diǎn)八
4. 英文:全部小寫
a) 字母拼讀小寫加空格:q q;k t v;m p三 切記:務(wù)必字母拼讀加空格
b) 單詞小寫,單詞單詞間加空格。如:“播放rolling in the deep”
5. 專有名詞,人名和地名可以搜索到的歌名要寫對(duì)。
6. 兒化音:一律不寫兒化音。爸爸去哪er→爸爸去哪
但是發(fā)音有“兒”的要寫出,比如:幼兒園,那些花兒…
7. 語氣詞: 音頻中說話人清楚地講出的語氣詞,如 “呃 啊 嗯 哦 唉 誒”等,要按照正確發(fā)音進(jìn)行轉(zhuǎn)寫。
8. 切音情況:切音的字聽的清可以準(zhǔn)確判斷出來,正常轉(zhuǎn)寫,并且截取進(jìn)紅線
切音的字聽不清,需要靠猜測(cè),這樣的不要轉(zhuǎn)寫,且這個(gè)切音的字不要截取進(jìn)紅線
9. 保存:保存繼續(xù)下一句快捷鍵(alt + enter),最后一句保存后,右上角出現(xiàn)提交按鈕,提交后質(zhì)檢才能查標(biāo)注員的任務(wù)。
10. 出現(xiàn)能確定發(fā)音,無法確定字形的情況,如果是歌名、專有名詞、地名等,需要百度搜索寫準(zhǔn)確; 如果搜索不到,用同音字代替(同音字發(fā)音和音調(diào)都要和音頻完全相同)
11. 一句話中一個(gè)字聽不懂可以使用標(biāo)簽~代替(≥2個(gè)字聽不懂,直接無效)
三、截取規(guī)范
1. 截取的區(qū)間音頻必須與文本一致。貼著音頻截取,從開始發(fā)音的點(diǎn)截取到結(jié)束發(fā)音的時(shí)間點(diǎn)。
2. 不要切到發(fā)音的字,不要有預(yù)留。
3. 前/后切音的字可以確認(rèn)就截取進(jìn)來,且轉(zhuǎn)寫
4. 前/后切音的字需要猜測(cè)出來,就不要截取進(jìn)紅線中,也不轉(zhuǎn)寫
四、標(biāo)簽:
{~}:代替不確定的或者聽不懂的1個(gè)字,一條音頻≥2個(gè)字聽不懂,直接無效
五、注意事項(xiàng)
a) 需要截取,不用預(yù)留,不要切到字。
b) 超時(shí)回收:正常任務(wù)24小時(shí)(返工待修改任務(wù)48小時(shí))后的凌晨3:07回收;
返工超3次,第4次返工系統(tǒng)回收
c) 新人第一個(gè)包做完提交后必須申請(qǐng)質(zhì)檢,首包通過后才可以自己隨便領(lǐng)任務(wù)了
d) 音頻 中有多人的語音重疊則無效,如果他人說話作為背景噪音的正常有效轉(zhuǎn)寫。一前一后說話也無效
e) 文本必須準(zhǔn)確不確定要百度,實(shí)在百度不到的才能寫同音同調(diào)(同音同調(diào)的字少用)
f) 只有1個(gè)字沒有意義的語音無效
g) 一段音頻有≥2個(gè)字聽不懂的,直接無效
五、返工任務(wù)查看方式
a) 看到自己有返工的人,先查看返工意見看質(zhì)檢檢查到哪句了比如檢查到30句;進(jìn)入該任務(wù)界面,先點(diǎn)擊右上角的“質(zhì)檢情況”看具體條目的質(zhì)檢的反饋結(jié)果
b) 改好全部有反饋結(jié)果的條目后刷新界面,這樣就能看到150句全部的條目,然后跳轉(zhuǎn)到第31句自檢,改好質(zhì)檢反饋的條目和31-150后可以再次提交給質(zhì)檢
六、數(shù)據(jù)審核標(biāo)準(zhǔn)和工資結(jié)算
申請(qǐng)的數(shù)據(jù)盡量在24小時(shí)之內(nèi)完成,超時(shí)系統(tǒng)會(huì)自動(dòng)回收。
每個(gè)任務(wù)包在質(zhì)檢通過之后,都會(huì)顯示出具體的有效時(shí)長
工資=有效毫秒/1000/3600*單價(jià)