与亲生子伦中文字幕,国产精品美女久久久久AV爽,人妻夜夜爽天天爽,在线播放无码后入内射少妇

登錄|注冊數(shù)據(jù)標注交流2000人QQ群:489587938客服QQ/微信:670201222

海天瑞聲long8-語音轉(zhuǎn)寫規(guī)范及標準

泛領(lǐng)域標注規(guī)范及標準

一.簡單介紹

本音頻內(nèi)容是客服對話電話語音數(shù)據(jù)。利用工具,對語音進行標注。標記時間戳,隔開一個一個的語音段,然后對每個語音段,分別標注說話人身份、文本內(nèi)容、說話人性別和情緒。

注意轉(zhuǎn)寫實實在在的人講話的聲音,視頻、電視里面的講話聲音不用轉(zhuǎn)寫。但是根據(jù)數(shù)據(jù)類型來判斷。夾雜主持人講話中的開頭或者中間的一些視頻播音片段,無效不轉(zhuǎn)寫;如果整段音頻都是視頻類語音,比如電視劇等,就可以全部轉(zhuǎn)寫。

二.操作步驟及方法

1. 首先登錄網(wǎng)址:http://182.92.174.146:5500/,登錄界面如下圖,用給定的賬號和密碼登錄;

2. 登錄進去之后,選擇申請任務,選擇項目名稱的任務,然后同意保密協(xié)議,就進入工作頁面開始工作;

 

3. 工作頁面如下圖所示,具體的切分標注步驟如下:

1) 首先,框1是音頻的播放區(qū)域,如果沒有勾選播放分區(qū)模式,點擊音頻波形,音頻會從點擊的位置開始播放。如果勾選播放分區(qū)模式,音頻會從本段的起始位置開始播放;

2) 然后判斷音頻是否有效,如果無效選擇無效,判斷無效原因即可,如果有效再繼續(xù)標注文本框2中屬性;

3) 其次,在文本框4中轉(zhuǎn)寫文本,并在需要的時候添加文本框3中的標簽,本段轉(zhuǎn)寫完畢點擊保存按鈕,切分標注好的段落會顯示在文本框5中;(編輯文本是播放暫停的快捷鍵是Alt+m,常用這個會事半功倍哦

4) 最后,整段音頻都切分標注完畢,點擊右上角的提交按鈕即可。

 

 

三.切分標注的標準

3.1 時間戳標記

a) 根據(jù)語義和停頓時間等因素,在音頻信號中每一句話的句首和句尾分別添加時間邊界,拖動鼠標即可添加。

b) 如果同一說話人說話時間較長,則應根據(jù)其語義來增加時間邊界,每個時間段的長度最多不能超過15s,但斷句也不要太散太短。

c) 一個語音段應該包含一個或多個完整的句子。例如“我想去吃飯”不能被分割為“我想去”和“吃飯”。

d) A說完改成B說后,在AB之間要分割(一個語音段只能包含一個說話人

e) 在進行語音切分過程中,有效語音前、后應盡量保留一定靜音部分(一般不得少于20ms),注意切分時邊界位置盡量準確,一般不應切到有效語音上。兩段之間如存在靜音,應為前后段保留一定靜音。在連續(xù)語音中放置邊界時,若無明顯停頓,切分標記要放在中間,不要傷害有效語音,不要貼著音頻切。

一個人的語音為一個段落不同說話人之間要分開,每個段落前后留不少于20ms(20ms其實很短就是為了不要切到語音上)的停頓不要貼著音頻切

1.:兩段間小于等于5秒,停頓平分到前后段落

2.:兩段間停頓大于5秒,中間多余停頓部分無效且添加相應標簽

f) 只有一個字表示應答的,如語音沒有overlap(重疊,則單獨分割成獨立語音段(如:嗯、哦、對);如有overlap,則標記主說話人語音,并在存在overlap的段落加overlap標記

3.2文本標注規(guī)范

a) 錄音轉(zhuǎn)寫的第一要求

忠實地按照音頻錄音念什么就轉(zhuǎn)寫成什么的原則,如真實發(fā)音為“我們?nèi)ツ哪睦锇 ?,“哪”字有重復,就要忠實地錄成“我們?nèi)ツ哪睦锇 薄?/span>

g) 口音問題

由于口音或個人習慣導致的音變,按普通話標注音錄入。多音字或者生活中有不同發(fā)音的字,也按照普通話標注音錄入。例如,“辦公室”的“室”,有人說成“shi3,有人說成“shi4”,都要錄成“辦公室”

h) 數(shù)字

數(shù)字符號應完全按照其讀音轉(zhuǎn)寫成對應的漢字,例如:5256->五千二百五十六,2004->二零零四兩千零四19%->百分之十九等。其中1”轉(zhuǎn)“一”或者“幺”,根據(jù)真實發(fā)音錄入。

i) 英文單詞或作為單詞發(fā)音的縮寫詞

對于英文單詞,或者作為單詞發(fā)音的縮寫詞,如果其發(fā)音是按照一個單詞來發(fā)音的,請直接轉(zhuǎn)寫,注意字母間要加空格。英文單詞小寫格式,字母大寫且空格。

例如,hello”、“G D PP P T Q Q 等。hello kitty

Eg您的Q Q郵箱是多少?遇到說網(wǎng)址的@要寫@。

如果出現(xiàn)拼音拼讀的,將聲母韻母分開轉(zhuǎn)寫聲母+下劃線_+py+字,如,勝利,轉(zhuǎn)寫為:sh_py eng_pyl_py i_py

j) 標點符號

只采用, 、。?‘!’ 即只能使用逗號,句號,問號,感嘆號。

句尾需要加標點且句尾標點不要是逗號。

k) 專有名詞

所有的專有名詞,包括人名、地名等,詳細規(guī)范說明如下:

§ 人名

對于熟知的知名人士的名字或地名,必須用該知名人士的名字來轉(zhuǎn)錄。

例如,“郭德綱的相聲很不錯”,就不能轉(zhuǎn)錄成“郭德剛”。

“阿里巴巴邀請白舉綱參加來往活動”,不能是“白句剛”。

而對于泛泛的名字,則都要用最常見的文字來標記。

例如,用“王小明”,不用“王曉明”,更不能用“王瀟銘”(這個太偏僻了)。

§ 中國的地名

與人名的轉(zhuǎn)錄規(guī)則類似。

§ 機構(gòu)名稱

與人名的轉(zhuǎn)錄規(guī)則類似。

l) 兒化音

需要把“兒”這個字標注出來

例如,“這個小孩兒”(當此語音的兒化音很明顯的時候)。

m) 填充語氣詞

填充語氣詞是指示說話者說話中的猶豫,或者說話者在思考下面該說什么時,用來保持發(fā)音連貫所使用的詞,例如,,‘嗯’等。語氣詞應該基本帶有口字旁。

ei誒,唉ai 

3.3 數(shù)據(jù)標標記

a) 標注中使用的標記:

(noise) 噪聲。

說話人發(fā)出的突發(fā)噪聲:

由說話者發(fā)出的噪聲可能有以下5種,分別對應呼吸聲咳嗽聲、笑聲、噴嚏聲和其他由嘴唇發(fā)出的聲音。

錄音及電信系統(tǒng)引起的噪聲

包括電話按鍵音、電話忙音、錄音系統(tǒng)的其他噪音等,都是通信系統(tǒng)主動發(fā)出的聲音(但沒有人或機器的說話聲,而不是摘機、掛機或干擾帶來的咔啦或呲呲雜音。

背景發(fā)出的突發(fā)噪聲:

此處的背景發(fā)出的噪聲專指由非說話人(背景)發(fā)出的具有突發(fā)性的噪聲。如出現(xiàn)在說話聲之間的掌聲、關(guān)門聲、汽車鳴笛聲、狗叫聲等。

持續(xù)的音樂聲

唱歌聲(有歌詞和旋律)

哼唱(沒有歌詞,但有旋律)

口哨聲

可能是別人唱歌、演奏,也可能是背景的電視、收音機發(fā)出的音

樂和歌聲

包括持續(xù)時間較長的彩鈴聲

(unk) 為無效文本內(nèi)容。

難以理解的段落

有時音頻文件的某一部分很難或不能理解其對應的文本,例如由聲音不清晰或者方言發(fā)音造成的難以理解的語音。

聽不懂的外語發(fā)音

方言

 (sil) 如出現(xiàn)明顯停頓,則標記停頓標簽,建議5秒。

(~)用波浪號表示語句中存疑的個別字詞。

(overlap)語音重疊

關(guān)于ovelap標簽的使用:overlap用于兩個或幾個人說話重疊時,轉(zhuǎn)寫出主要說話人的語音內(nèi)容,選中重疊的部分,點擊添加overlap標簽,

這時在語音前后會出現(xiàn)兩個標簽,也就是兩個標簽中間的部分是重疊語音段(這個語音段是主要說話人的語音內(nèi)容)

 

b) 段落屬性標記:

有效性:篩選階段對音頻進行有效性篩選;如果是無效語音,則后面的標記就不用考慮了。

說話人身份:客戶1,客戶2等依次類推;

性別:[F]/[M];

口音:有口音/無口音; 按照有無明顯口音為標準

背景噪音(底噪):整個音頻有連續(xù)性背景噪音/整個音頻無連續(xù)性背景噪音,包括敲打鍵盤聲音、其它人聲音、電視背景音、汽車聲音等; 按照是否明顯判定

起止時間: 拖動鼠標進行截取

情緒:正面/平靜/負面.

異常音:是;否。比如音量截幅,設(shè)備持續(xù)雜音等,都屬于異常情況。

說話方式:正常;不正常。比如大聲喊叫,洋腔怪調(diào)等,都屬于不正常的說話方式。

說話人類型:正規(guī)播報;口語播報。一般都選擇口語播報,類似于新聞聯(lián)播的選擇正規(guī)播報。

c) 標點符號:只能使用逗號,句號,問號,感嘆號。

 

 

3.4 說話人身份

說話人層中標注該段語音的說話人的身份。在選擇說話人身份時

1.正常的客服客戶對話,正常選擇客服客戶;

2.主持人和采訪者的對話,主持人選擇客服,采訪者選擇客戶;

3.不能分辨客服,客戶,也不是在主持人訪談的,就統(tǒng)一選擇客戶。

第一個出現(xiàn)的客服講話,選客服1,第二個出現(xiàn)的選擇客服2,以此類推;第一個出現(xiàn)的客戶講話選客戶1,第二個出現(xiàn)的客戶選客戶2,以此類推。

 

常見問題解析:

1. 斷句

根據(jù)語義和說話人身份分段,每段不超過15,并且每段只包含一個說話人,不能把一句話分成兩半,盡量保證語義完整。但也不要切分的過細,一個人說話不超過15秒的可以放在一段。

2. 標簽

noise和底噪的區(qū)別

noise是短促突發(fā)的噪聲,底噪是背景持續(xù)存在的噪聲

 

 

noisesil的區(qū)別

大于五秒的停頓需要單獨成段,選無效,根據(jù)是否有背景噪音來選noise或者sil

 

unk~的區(qū)別

這兩個都可以代表聽不清聽不懂的字或者詞。不同點是小于5個字的話直接用~來代替;如果大于五個字的話就需要單獨成段,選無效標unk了。

unk不會和文本混在一起用也就是5字以上聽不懂單獨成段,選用標簽unk

 

 

3. 文本

不能丟字漏字,不能寫錯別字,有口音的不改字,語氣詞不能省略并且不能出現(xiàn)錯別字。

無效的沒有15時間限制,只要是無效的比如持續(xù)20的噪音可以放在一起。

本次注意

1.方言嚴重聽不清的無效

2.多人說話重疊部分能分清主次的寫主要說話人加overlap,分不清主次的無效

3.能明確是客服客戶對話的標客服和客戶,要不第一個人標客戶一,第二個人標客戶二,以此類推

4.整個包大部分是音樂,方言還很嚴重,只能聽清三五個字的,整包無效即可

5.回聲和人說話重疊部分無效,單純的回聲也不用轉(zhuǎn)寫直接無效,大家注意哈

 

 


推薦文章

戶型圖家具標注規(guī)則和視頻教程下載視頻點擊視頻右下角三個點多看幾次教程規(guī)則下載標注規(guī)則更新430.docx問題總結(jié).docx1、如果能直接通過外觀觀察確認家具的類別、大小及其數(shù)量,需要準確標注;在能通過外觀觀察確認家具的存在、形態(tài)及其數(shù)量的前提下,如果能通過相互關(guān)系(如沙發(fā)茶幾的搭配)確認的家具, 需要標注準確類別。反之(如陽臺遮陽傘下不確定數(shù)量、形態(tài)的家具),則不標注。2、如果遇到局部遮擋的已確認類別的非主要家具(如被餐桌遮擋的餐椅),可以自己推測標出其大小及范圍。3、 如果不能準確確定類別的,或者可能有歧義的“非主要”家具,那么可以不標。4、 如果無法標注的家具在這個區(qū)域內(nèi)是主要家具, 那么這個區(qū)域可以整體留白不用標注(包括家具及空間)。5、 如果遇到異形家具,根據(jù)具體的家具進行標注: a)餐桌為圓形,那么舍棄椅子, 用一個接近餐桌面積的矩形標注餐桌即可。 b)沙發(fā)為L形, 那么拆開為兩個矩形進行標注。 c)柜子為不規(guī)則形狀, 拆開為多個矩形拼接標注。 6、空間標識標記的前提是四面環(huán)墻, 除了客廳餐廳。下面的衣帽間空間用途就是錯誤的。7. 關(guān)于窗戶,大部分是按基礎(chǔ)圖示表示,但是因為數(shù)據(jù)底圖種類繁多,導致畫法不一定相同。這個時候,要看一下陽臺窗、臥室普通窗、飄窗和墻體的對比,如果有明顯不一樣可以區(qū)分,而且相應的窗戶在這個位置合理。就可以標注了。如果落地窗和普通窗難以區(qū)分,那么都標普通窗也是可以的。具體情況具體分析,不明白請截圖過來一起討論。標注流程 (調(diào)整包括調(diào)整墻體門窗、家具位置方向大小、選定空間用途)具體家具床類:頂端貼墻,箭頭指向床尾方向。床尾凳:方向和對應床方向一致。榻榻米:榻榻米一般三面貼墻,箭頭指向唯一不貼墻方向。床頭柜:和床的方向相同。 沙發(fā):靠墻的貼墻標記,不靠墻的按底圖位置標記,方向由靠背指向坐墊方向。如果是L型沙發(fā)則用兩個沙發(fā)矩形拼接,如果是弧形沙發(fā)則外包矩形。茶幾:面向主沙發(fā)(即人使用方向)。其他小茶幾或者邊桌考慮它儲物空間的位置朝向,原理和斗柜、衣柜相同。各種柜子如斗柜衣柜裝飾柜櫥柜陽臺收納柜書柜等:貼墻且方向指向拉門或者開抽屜方向。儲物間符號不明的柜子按衣柜標注。餐桌餐椅:餐桌朝向有餐椅的方向,餐椅逐個畫出且方向指向餐桌。適當畫出餐椅被餐桌遮擋部分。玄關(guān)柜和鞋柜和餐邊柜區(qū)分:鞋柜比較窄小低矮,玄關(guān)柜通常較高較寬。如果柜子嵌在門口墻壁里大多數(shù)是玄關(guān)柜;如果柜子較小且上面有擺件則大多是鞋柜。如果在餐桌旁邊一般是餐邊柜。如果只有一個柜子既符合餐邊柜又符合鞋柜玄關(guān)柜,那么優(yōu)先鞋柜玄關(guān)柜。空調(diào):立式與懸掛,方向箭頭指向通風口??照{(diào)器外機ac 不用標。立式大多數(shù)在客廳,懸掛大多數(shù)在臥室。 櫥柜:先選中櫥柜分類按照底圖用矩形拼接出櫥柜形狀,然后分別選擇灶臺和水槽在櫥柜矩形上層對應標記。有煙道的注意不要覆蓋煙道。煙機:一般形態(tài)為覆蓋在灶臺上的或者虛線或者實線的矩形。冰箱:一般在櫥柜旁邊,箭頭指向開門那一面。 浴缸:浴缸一般三面貼墻,箭頭指向唯一不貼墻方向。淋浴:標記隔斷內(nèi)區(qū)域或者沒有隔斷的標注人體活動范圍,注意必須貼墻。浴缸淋浴旁邊如果有平臺類結(jié)構(gòu),拉長標記覆蓋。衛(wèi)浴柜和水槽:衛(wèi)生間里面的洗手池一般標衛(wèi)浴柜,陽臺和櫥柜上的水槽標水槽。坐便器:第一個可能是在水箱是放了些東西,所以只是坐便器;第二個后面是平臺或者墻體包圍管道,所以要標墻。不標墻的話就成了坐便器離墻有距離,不合理??傮w原則按圖標。 圓形家具:外接矩形標記。綠植:盆栽外包矩形標記,如果以一片綠植形態(tài)出現(xiàn)則標記該區(qū)域。飄窗上綠植需要標記。洗衣機:一般在陽臺,也有少數(shù)在衛(wèi)生間等地方。入戶花園可以標注為陽臺。一些不易區(qū)分的圖像(不完全,只是一些舉例):空調(diào)淋浴書柜其他戶型1.主要戶型區(qū)域外的房間不需要標注并且刪掉。 2.主要戶型之外的樓梯、電梯可以不標。3.如果出現(xiàn)兩戶型圖并列在一張紙上;沒家具少家具;比例尺有問題(看下面判定方法);圖片變形;重復圖片;明顯是拍照拍出來的;立體圖;不是戶型圖的其他圖;清晰度實在不高;有大面積斜墻的圖片等,麻煩上報id給我們刪掉,不然這些也是不算數(shù)的。4.比例尺判定一是從家具角度,標注圖上hight或width不現(xiàn) 實的,比如雙人床長2.5m,寬1m。(只是舉例子)二是從戶型圖精確度角度,橫縱比例差太多,在其中一條比例尺設(shè)定完成后比對一下第二個比例尺,另一條差值范圍超過20%則不合格。(動圖給你們發(fā)過)5.沒有比例尺的圖片,用界面上的比例尺測量床的長度為2000或者柜子厚度600??偨Y(jié)一下:3、4為了判定圖片是否合格,在合格基礎(chǔ)上看1、2選擇可以標注的部分,然后用5來設(shè)定比例尺。(當然以上五點是少部分情況)細節(jié)(有待補充)最關(guān)注的地方:方向、范圍、類別,相互之間的配合。不允許出錯的地方:同上容易出錯的地方:忽視已經(jīng)識別好的戶型不加修改。

熱門文章

滴滴語音標注規(guī)則要求及視頻教程
一、標注環(huán)境1. 請使用谷歌瀏覽器進行標注。2.標注平臺地址:http://label.xiaojukeji.com/labelerTaskList二、標注內(nèi)容1. 語音有效性標注無效語音請在有效性一項選擇“無效”,并在標注文本一項標注大寫字母“NULL”。有效語音請在有效性一項選擇“有效”。當語音出現(xiàn)下列任意一種情況,即可標注為無效語音:1) 說話人聲音極小,小到幾乎聽不到。2) 整段語音均為靜音。3) 整段語音均為噪聲、音樂聲、導航音、廣播等。4) 整段語音只有一個字,或是同一個字重復出現(xiàn)。如:“嗯”、“對”、“對對對對”、“啊”、“喂”、“拜拜”、“謝謝”、“好好好”、“OKOK”等。(注意:“哇噻”屬于特例,單獨出現(xiàn)時也是無效的。)5) 背景噪聲大于說話人聲音,或噪聲與說話人聲音幾乎一樣大。6) 整句都是方言、外語。方言是指發(fā)音與普通話區(qū)別較大的地方話,如:粵語、上海話等。7) 語音中出現(xiàn)地點、地名、街道名等方位詞,但是地圖中搜索不到。8) 語音中有大于等于兩個人說話,除主說話人以外,其余人的聲音清晰可辨。9) 語音中有大于等于3個字聽不清楚。 2. 語音文本標注1) 語音文本內(nèi)容將說話內(nèi)容寫成文字。要求轉(zhuǎn)寫的文本內(nèi)容必須和聽到的語音完全一致,不能多字、少字。a) 除空格、占位符號、以外,標注文本不允許使用標點符號,不允許換行。b) 說話人猶豫、口吃導致出現(xiàn)重復的字也要標注出來,重復了幾次就標記幾個。如發(fā)音為:我是北北京人;“北”字有重復現(xiàn)象。轉(zhuǎn)寫文本應為:我是北北京人c) 兒化音不需要標注出“兒”字。如發(fā)音為:我在/zher4/。轉(zhuǎn)寫文本應為:我在這d) 語音中提及地名、街道名、車牌號等內(nèi)容,轉(zhuǎn)寫時需符合日常習慣。選用“路”、“街道”、“門”、“座”、“橋”等地名常用字以及“京”、“津”、“冀”等車牌號常用字。e) 語音中提及地名、街道名、店鋪名、專有名詞,需要準確轉(zhuǎn)寫??筛鶕?jù)讀音在地圖中查找,確實存在該地點則進行準確標注,搜不到則無效;f) 語音中確實聽不清楚的個別單字,用占位符號【~】標記。一組【~】符號代表一個字。在整段語音中,最多只能有兩組【~】符號。若有三個字或更多聽不清楚,則標注為無效。(見“語音有效性標注”第8條)g) 語音中不涉及地名、專名的部分,若發(fā)音清晰但文字不確定,可以用同音字標注,要求標注用字的聲韻調(diào)與實際發(fā)音完全一致。如發(fā)音為:我姓/zhang1/。標注成“我姓張”或“我姓章”都算正確。h) 數(shù)字要寫成漢字形式,注意區(qū)分“一”和“幺”、“二”和“兩”,按實際讀音寫。i) 英文字母要轉(zhuǎn)寫成大寫字母。j) 音頻中說話人清楚說出的語氣詞,如“呃、啊、嗯、哦、唉、吶、呢”等,要按照正確發(fā)音進行轉(zhuǎn)寫。語氣詞除了“了、不”沒有口字旁,其他基本上都有口字旁。注意:語氣詞“唉”、“誒”不分的,統(tǒng)一用“唉”。 3.語言情況標注1)語音中全部內(nèi)容均為中文,請選擇“中文”。2)只要語音中含有英文,不論是單個字母還是單詞、不論出現(xiàn)的數(shù)量有多少,都需要選擇“英文”并且字母全部大寫。1、遇到英文單詞和英文字母都需要用英文大寫形式表現(xiàn)。例如:SORRY SORRY我現(xiàn)在在阜成路麻煩你掉個頭2、單詞與單詞之間加空格 。例如:我把我的APPLE SEVEN PLUS落在了車上麻煩師傅還給我一下3、字母與字母之間加空格。例如:我下了好幾回這個A P P了但是怎么安裝都是失敗的請問客服我該怎么辦4、英文單詞或者英文字母與漢字之間不需要空格。例如:我的車牌號的京A三六七八5、特殊字:對于OK這一類常用詞,默認為一個單詞,盡管是拼讀成字母發(fā)音的。對于無從適配上述規(guī)則的及時與我們溝通 4. 說話人性別標注按說話人的音色實際情況進行標注。若無法明確區(qū)分男女,不論是成人還是兒童,都標注為“女”。三、標注常見問題總結(jié)1. 短句如何判斷有效性?答:短句只要有大于或等于兩個不重復的音節(jié),即為有效。例如“嗯好的”、“明白”、“可以”等。 2. 有明顯口音,但能聽懂,需要標注嗎?答:口音但不影響理解的,音頻中個別幾個字的方言可以使用同音字標注。聽不清音節(jié)的方言也無法使用同音字標注的,可以使用【~】,大于或等于三個字需使用【~】符號的情況下。參照“語音有效性標注”第8條規(guī)則,標記為無效。 3. 標注時有的口音能聽懂,是按聽的音來標注還是按普通話來標注,標注需要符合現(xiàn)實邏輯嗎?答:一般情況下口音按實際發(fā)音來標注。以下情況請?zhí)貏e處理:常用詞語和專有名詞需按現(xiàn)實邏輯標注(如:發(fā)音是“現(xiàn)/xian4/生”標為“先生”,“滴滴專/ce1/”標為“滴滴專車”等等) 5. 音頻中一串數(shù)字如【12531】轉(zhuǎn)寫為一二五三一還是吆二五三吆?答:轉(zhuǎn)寫的文本要和語音實際讀法完全一致。若讀為yi1,則寫一;讀為yao1,則寫幺。同理,“二”、“兩”、“倆”;“三”、“仨”也需要區(qū)別使用。 6. 一段很短的音頻中語速過快,有時候聽起來像三個字又像兩個,是不是都能判斷合格?答:短音頻且內(nèi)容無法聽清的情況下,標記為無效。長音頻中很小的一部分,無法確定內(nèi)容時,參照“語音文本內(nèi)容”下f項、【~】符號使用規(guī)則進行。 7. 一段音頻中語速過快,能聽清某些音節(jié)但大多部分不能做出準確判斷寫不出是否可以判斷無效?答:判斷為無效 8. 一段音頻中出現(xiàn)導航儀發(fā)出的聲音或者只有導航儀的聲音算噪音嗎?答:整段只有導航音,標記為無效。只有一部分出現(xiàn)導航音的時候,看聲音大小,如果與說話人音量接近或者大于說話人聲音,標記為無效。 注意:如果一句話里面只說了幾個字方言,其他都是帶口音的普通話,不要直接標無效,那全方言的字按聽到的音來標,比如:說的是上海話gege,就標成“葛個”,而不是標成“那個”。語氣詞無法轉(zhuǎn)寫的可以找同音字或相近音字轉(zhuǎn)寫;全方言無效 關(guān)于地點、地名、街道名等方位詞,這些詞我們需要使用地圖搜索引擎搜索如果地點、地名、街道名等詞語很長且詞發(fā)音很清晰,但使用地圖搜索引擎搜索不到這個地點。即使這句話其他部分可以完整的轉(zhuǎn)寫出來,但依舊視為無效。二、關(guān)于英文轉(zhuǎn)寫原規(guī)范為:英文字母要轉(zhuǎn)寫成大寫字母。        細化:1、遇到英文單詞和英文字母都需要用英文大寫形式表現(xiàn)。例如:SORRY SORRY我現(xiàn)在在阜成路麻煩你掉個頭2、單詞與單詞之間加空格 。例如:我把我的APPLE SEVEN PLUS落在了車上麻煩師傅還給我一下3、字母與字母之間加空格。例如:我下了好幾回這個A P P了但是怎么安裝都是失敗的請問客服我該怎么辦4、英文單詞或者英文字母與漢字之間不需要空格。例如:我的車牌號的京A三六七八5、特殊字:對于 OK 這一類常用詞,默認為一個單詞,盡管是拼讀成字母發(fā)音的。對于無從適配上述規(guī)則的,我們及時向海瑞提出。三、噪音符號這部分,這部分依舊不用添加。 四、關(guān)于標普、方普、方言如何轉(zhuǎn)寫    1、標普:就是普通話,我們是一定要轉(zhuǎn)寫的。    2、方普:就是方言普通話,例如廣州人說普通話,上海人說普通話,天津人說普通話等等,這些是需要轉(zhuǎn)寫的。只是他們在說普通話的時候會有一些口音。例如發(fā)音說:我現(xiàn)在湖南(fu2聲 lan2聲)長沙市中心你來接我一下     他說的是“fu lan”我們正常書寫成“湖南”即可。    3、方言:直接視為無效即可,例如:粵語、上海話、江蘇話等等。