与亲生子伦中文字幕,国产精品美女久久久久AV爽,人妻夜夜爽天天爽,在线播放无码后入内射少妇

登錄|注冊數(shù)據(jù)標注交流2000人QQ群:489587938客服QQ/微信:670201222

利用70萬人的勞動力來標記數(shù)據(jù)和訓練AI模型

數(shù)據(jù)集是人工智能(AI)的生命線 - 可以說,它們使模型成為可能。但是,沒有相應注釋的數(shù)據(jù)取決于正在運行的算法的類型(即,監(jiān)督與無監(jiān)督),或多或少是無用的。這就是為什么像Scale這樣的樣品標簽創(chuàng)業(yè)公司籌集了數(shù)千萬美元,并吸引了優(yōu)步和通用汽車等客戶。這就是為什么Kevin Guo和Dmitriy Karpman共同創(chuàng)辦了Hive,這是一家使用由數(shù)十萬志愿者提供的注釋數(shù)據(jù)來培訓特定領(lǐng)域AI模型的創(chuàng)業(yè)公司。

擁有近100名員工的Hive在從PayPal創(chuàng)始人Peter Thiel的創(chuàng)始人基金和其他人那里籌集了超過3000萬美元的風險投資之前不久推出了旗艦產(chǎn)品--Hive Data,Hive Predict和Hive Enterprise。

Hive AI

“我們建立了[Hive],因為我們覺得雖然圍繞人工智能和深度學習有很多興奮,但我們沒有看到很多實際的應用程序正在構(gòu)建,”郭在電話采訪中告訴VentureBeat。“有很多炒作,但他們真正要解決的問題似乎并不明顯。大多數(shù)這些都是有些工作的演示,但并不是真正的企業(yè)級?!?/span>

為此,Hive通過Hive Work招募了大部分人類數(shù)據(jù)貼標人,Hive Work是一個智能手機應用程序和網(wǎng)站,指示他們完成分類圖像和轉(zhuǎn)錄音頻等任務。作為交換,Hive發(fā)放了一小筆獎勵 - 每周數(shù)萬美元。(郭說它可以使用“激增定價”來確保在必要時更快的周轉(zhuǎn)時間,例如當Hive客戶有特定項目時。)

該戰(zhàn)略取得了成功。Hive在其貢獻者社區(qū)中的30多個國家/地區(qū)擁有近700,000名用戶,他們每天幫助處理大約一千萬個標簽,準確率達到99%。(這種準確性部分歸因于一個淘汰系統(tǒng),它每隔一段時間就會進入“已知”任務,確保用戶不會對系統(tǒng)進行游戲。)客戶通過提供數(shù)據(jù)標簽服務的Hive Data挖掘員工隊伍。針對多個垂直行業(yè)量身定制。

“獲取培訓數(shù)據(jù)來構(gòu)建這些模型實際上非常非常重要。從某種意義上說,自動化的唯一方法就是招募大量的人力,這幾乎具有諷刺意味,“郭說。“你可以擁有最好的框架,但如果沒有良好的訓練數(shù)據(jù),你將無法獲得良好的輸出。我把它比作一個人類的頭腦:你可以擁有最聰明的大腦,但如果你不教這個大腦貓狗之間的區(qū)別并展示它的好例子,它就永遠不會認識到貓與狗之間的區(qū)別?!?/span>

Hive Work的輸出還提供Hive Predict,為企業(yè)提供定制設(shè)計的計算機視覺模型,幫助企業(yè)實現(xiàn)業(yè)務流程自動化; Hive Enterprise,針對汽車,零售,安全和媒體等領(lǐng)域,提供從頭開始構(gòu)建的專有數(shù)據(jù)的定制深度學習模型。Hive使用基于Google開源TensorFlow框架的后端,通過API或云開發(fā)AI系統(tǒng),或與集成合作伙伴合作設(shè)計內(nèi)部部署解決方案。

到目前為止,憑借其內(nèi)部服務器和網(wǎng)絡(luò)基礎(chǔ)設(shè)施,Hive創(chuàng)建了機器學習模型,可識別活動,預測年齡和性別,對汽車進行分類,確定相機傳感器與感興趣主體之間的距離,甚至可以檢測爆炸等事件,電視節(jié)目中的槍聲,戰(zhàn)斗和廣告。郭拒絕透露Hive的任何客戶的名字,但表示每個客戶每個月都會發(fā)出數(shù)千萬的API請求。

Hive的模型之一 - 徽標模型API - 當然會檢測徽標,但也會檢測它們顯示的產(chǎn)品或廣告以及它們可見的持續(xù)時間。Hive聲稱,與Google Vision Cloud的5%召回率和66%的精確度相比,它具有99%的召回率和98精度。

Hive每周增加100個徽標,目標是在2018年第四季度達到10,000。

“我們的質(zhì)量標準遠遠高于其他所有人,”郭說。“我不希望[Hive]成為另一個真正過度的人工智能公司,它實際上無法構(gòu)建技術(shù),我認為這對整個空間來說并不好?!?/span>


推薦文章

百度有一天在某硬件領(lǐng)域成為全球第一,這句話似乎聽起來很離奇。如果說這個領(lǐng)域的直接對手,是亞馬遜、谷歌、蘋果等北美科技巨頭,那幾乎就更有點神乎其神了。 然而根據(jù)Canalys最新數(shù)據(jù)報告,在2019年Q2百度智能音箱出貨量繼續(xù)居于國內(nèi)市場第一的前提下,已經(jīng)超過谷歌攀升到了世界第二,前面只有亞馬遜最早入場的智能音箱Echo,這個占盡天時地利的對手。  要知道,從小度在家發(fā)布至今,百度做音箱僅僅經(jīng)歷了一年半的時間。從初入江湖到中國第一世界第二用了如此短的時間,百度智能音箱產(chǎn)品的全球市場份額,比一年前增長了令人“驚恐”的3700%。只能用慘無人道來形容的增長曲線,似乎正在確立百度硬件領(lǐng)域的生存與發(fā)展空間。 而毫無疑問,小度音箱的出貨量能否大于亞馬遜是一個關(guān)鍵指標,甚至將成為智能音箱發(fā)展史的拐點。另一方面,我們知道華為手機在成為世界出貨量第一的路上,受到美國以國家力量干擾,至今沒有完成。百度能否在音箱之路換道超車,自然也會引發(fā)國人強烈關(guān)注。 那么“音箱第一大廠”到底能不能換人?答案其實是由三個問題決定的。   路線之問:市場到底想要什么音箱? 用戶對小度產(chǎn)品未來的好奇,歸根結(jié)底在于小度攀升速度過快,大家會奇怪這種急速拉升究竟是一個可保持的長期趨勢,還是短時間刺激效應下的虛假繁榮? 換句話說,小度究竟是走在正確的路上,還是僅僅踩了個幸運蘑菇? 這個問題必須交給智能音箱短暫但急促的發(fā)展史去回答。亞馬遜Echo與谷歌Nest系列之間的關(guān)系,頗有點像天貓精靈與小度。只是中國市場相對更復雜,還要加上小米以及眾多已經(jīng)告別歷史舞臺的音箱產(chǎn)品。  如果說中美兩開花,不,是兩條線有什么共同特點,就在于“技術(shù)流”蠶食“電商流”是個必然趨勢。谷歌憑借Assistant不斷升級的語音交互能力,以及與安卓生態(tài)的關(guān)系,在亞馬遜已經(jīng)牢牢占據(jù)的智能音箱江山里殺了出來,做到今天北美市場快要分庭抗禮的程度。而國內(nèi)音箱“三巨頭”,小度起步最晚,卻通過小度助手背后強大的技術(shù)能力,不斷分割小米和阿里的市場份額,拓展智能音箱的市場邊界。 不難看出,智能音箱落腳市場的關(guān)鍵還是智能技術(shù)。聲音識別、喚醒、語義理解、多輪對話等能力構(gòu)成了這個硬件值得被使用的基礎(chǔ)。技術(shù)體驗不流暢,可能直接造成打開率下降,影響市場購買率。這個硬卡位的存在,讓電商體系與IoT體系帶來的賦能相形見絀。 這個邏輯的最新論據(jù)在于,谷歌今年沒有拿出什么能夠引發(fā)極客們熱情高漲、用戶付出真金白銀的技術(shù),而是更多在產(chǎn)品的系列化以及周邊設(shè)計上下功夫。無論我們將其看作調(diào)整周期還是谷歌的技術(shù)創(chuàng)新疲軟,最終結(jié)果就是谷歌挑戰(zhàn)亞馬遜的步伐減慢,在全球范圍內(nèi)被百度完成了銷量反超。 而與小度硬核崛起所同步的,恰好是底層技術(shù)創(chuàng)新。在不久前發(fā)布并已經(jīng)搭載到小度音箱產(chǎn)品中的小度助手5.0,喚醒能力上加入了流式截斷的多層注意力模型(SMLTA);在語義理解算法層融合了百度NLP的知識增強語義表示模型ERNIE,小度助手的核心理解算法升級為超大數(shù)據(jù)預訓練深度模型,讓眾多NLP任務都有了新的表現(xiàn);此外,全雙工免喚醒能力的加入,讓小度助手5.0有了人類之間對話時的“拒絕反應”,能夠一次喚醒多次交互,讓音箱主動分辨何時“不說”。 另一個值得注意的技術(shù)-產(chǎn)品關(guān)鍵問題,來自于帶屏音箱新品類的市場認可。根據(jù)Canalys數(shù)據(jù)報告,在Q2小度全球音箱出貨量中,有45%是帶屏音箱。可見用戶對這一新產(chǎn)品品類已經(jīng)有了深刻接受度。而Canalys也指出,百度在帶屏音箱中近乎于是沒有競爭對手的。這條產(chǎn)品路徑,正在成為小度的獨屬紅利。用戶對于智能音箱體驗的認可和需求,從來就沒有降低過。換言之核心技術(shù)才是智能音箱的主要矛盾,從美國的谷歌生吃亞馬遜,到中國的“千箱-三箱-小度超級箱”之路,都可以佐證市場核心邏輯的所在位置。 那么回到最初的答案,持續(xù)保持底層技術(shù)創(chuàng)新的百度,與長時間缺乏底層AI技術(shù)創(chuàng)新的亞馬遜,處在一個努力奔跑,一個緩慢散步的進程里。百度反超,是存在戰(zhàn)略上可能性的。 那么從戰(zhàn)略到戰(zhàn)術(shù),關(guān)鍵問題在哪呢?   大媽之問:中國市場到底有多大? 通過底層技術(shù)創(chuàng)新,拉動技能開發(fā)生態(tài)和內(nèi)容平臺,這樣的模式讓國內(nèi)智能音箱市場快速從三強爭霸變成了一超兩強。在小米和阿里近期無力概念技術(shù)和生態(tài)格局的條件下,這個局面今天來看應該會一直持續(xù)下去。 但是百度能否挑戰(zhàn)世界第一的位置,很大程度上并不取決于國內(nèi)競爭。因為現(xiàn)在中美音箱是你賣你的我賣我的,大家沒事不串門。所以銷量規(guī)模上的比拼,源自于各自市場容量的邊界。換句話說,百度到底能把中國市場做到多大,是否能讓中國市場音箱保有量超過美國,這個才是問題關(guān)鍵。 毫無疑問,中國市場上的智能音箱,正在享受互聯(lián)網(wǎng)模式下的人口紅利。根據(jù)Canalys預測,今年中國內(nèi)地智能音箱數(shù)量將同比增長166%,效率冠絕全球,是美國46%增速的三倍。 這樣的市場增速來源是多方面的,首先中國市場智能音箱的性價比依舊重要,這讓智能音箱在中國市場基本屬于無門檻消費。再者隨著小度等音箱不斷完善能力和內(nèi)容,音箱的受眾范圍得到不斷推廣,家庭市場、教育市場在不斷深化。  但真正決定中國市場銷量邊界的,其實是下沉市場的打開效率。幾個月之前,我采訪過煙臺農(nóng)村的一位大姐,她告訴我她家有一臺小度在家,兩臺小度音箱(無屏版)。而這樣的配置在她們村并不少見??梢灾苯訉υ挘{(diào)出音樂、內(nèi)容,以及應用的智能音箱,正在與中國廣袤的黃土地毫不違和地沾粘在一起。 在理解智能音箱下沉市場的邊界有多大時候,必須正視今天這樣幾個現(xiàn)狀: 1、智能音箱搶占的是誰的市場?在具有長時間內(nèi)容收聽能力的市場里,不是一種音箱打敗另一種音箱,而是這種智能交互模式+內(nèi)容通道,收割收音機、低音炮、電視,甚至手機的存在時間。音箱體驗的簡便性,會從下沉市場首先發(fā)酵。 2、互聯(lián)網(wǎng)服務增值模式與音箱之間的聯(lián)系,構(gòu)成了很多內(nèi)容、電商、教育可以圍繞音箱打開。這些內(nèi)容在大都市可能很自然通過手機獲取,音箱更多屬于垂直人群,但在下沉市場,手機性能并不強,反而是便宜的音箱更可能成為入口。因此音箱的人均普及價值可以很快超越手機。 3、下沉市場的增長法則相對明確,大覆蓋面廣告效果明顯。在春晚植入和熱播綜藝的普及下,如今用戶已經(jīng)對智能音箱產(chǎn)生心理預期和理解能力,市場教育周期已經(jīng)基本完成。 在這三個條件下,智能音箱的市場邊界還遠遠沒有達到頂點。小度貫穿一線城市到鄉(xiāng)村的銷售覆蓋網(wǎng)絡(luò),則強化了小度的市場打開通道。 如果繼續(xù)保持目前的增長速度,小度基于中國市場的穿透力,銷量超越亞馬遜將不需要太長時間。無論國外媒體感覺多么不可思議,中國大媽說,這事是我們罩的。   蘋果之問:去往海外的音箱如何生存? 再向更遠處看,中美智能音箱的冠軍,必然在世界范圍內(nèi)還有一戰(zhàn)。但這場戰(zhàn)斗發(fā)生在哪大有學問。 事實證明,美國音箱想在中國存活近乎不可能;看川普推特里的小情緒,中國音箱想進美國大概短期也不現(xiàn)實。 到2019年年底,全世界智能音箱預計可以達成2億臺的安裝量,其中中國6000萬,美國9000萬。那么也就是說,全球還有四分之一非中非美市場。 根據(jù)Canalys的數(shù)據(jù),這些市場份額里,目前對智能音箱接受度最好的是日本和韓國。在Q2這兩個市場分別達成了131%和132%的增速,僅次于中國名列二三。 必須注意的是,這兩大市場使用的語言既不是英語也不是漢語。所以從AI巨頭輸入產(chǎn)品解決方案時,這些市場需要的是多輪對話、語義理解、NLP的底層能力。 亞馬遜和百度,誰能在這全球四分之一的市場里占領(lǐng)未來呢?這個遠距離推測很可能給人不公允的感覺。但不妨來看一下,已經(jīng)在中國賣了大半年的蘋果智能音箱,是怎么失敗的。事實上,蘋果的HomePod基本可以判斷為一款失敗的產(chǎn)品,只不過是北美小敗其他市場大敗而已。4月,蘋果不得已宣布HomePod永久降價50美元,可見其失利幅度之大。 蘋果的音箱之痛,可以總結(jié)為三個問題:智能交互太差,尤其是非英語體驗極其不好;昂貴的定價在其他智能音箱玩家面前沒有任何競爭力,反而有濃厚的智商稅嫌疑;應用體系,內(nèi)容服務和IoT生態(tài)都沒有,消費者不知道買來干什么。 蘋果的問題,沒有哪家企業(yè)敢不吸取。于是我們可以看到,音箱出海,脫離了本身市場的知名度和品牌能力之后,真正比拼的是三點:技術(shù)能力、定價能力、生態(tài)服務。 回到百度和亞馬遜未來可能的出海對決中,今天底層技術(shù)的創(chuàng)新百度已經(jīng)領(lǐng)先于業(yè)界,語音智能相關(guān)的底層算法幅度,更是從今年開始領(lǐng)先了AI老大哥谷歌,這是前所未見的。 而定價能力上,更靠近中國完善產(chǎn)業(yè)鏈的百度,顯然不會拿出貴到離譜的產(chǎn)品走向世界。反而因為音箱品類的集成度有效,凈值又不高,北美巨頭很難在代工模式中發(fā)揮手機和平板的成本控制能力,很可能在直接與中國品牌的碰撞中陷入尷尬。 那么最后在生態(tài)服務能力上,百度與亞馬遜如果真的展開較量,那就將是亞馬遜依然強勁的世界電商網(wǎng)絡(luò)能力,與百度代表的中國互聯(lián)網(wǎng)服務模式的纏斗。這其中需要發(fā)揮中國互聯(lián)網(wǎng)公司源源不斷的運營和服務創(chuàng)新能力,可能要經(jīng)歷一場群狼搏虎的戰(zhàn)斗。 雖然這個類比并不意味著真正的未來,但是2比1,是絕對能夠說明某種態(tài)勢的。而且出海之戰(zhàn),百度真正迎戰(zhàn)谷歌或者亞馬遜的時候,大概率小度已經(jīng)是全球第一大音箱廠商了。 從無人機,到手機,再到音箱,世界第一并不只是個名號,還是中國科技產(chǎn)業(yè)不容放棄的話語權(quán)。當百度成為世界音箱一哥的同時,也是下個時代的大門被悄悄推開的時候。

熱門文章

        對數(shù)據(jù)標注行業(yè)稍微有些了解的人都知道數(shù)據(jù)標注進入門檻低,適合很多人兼職也適合創(chuàng)業(yè)。        正是因為數(shù)據(jù)標注行業(yè)的門檻低這個特點最近兩年從事數(shù)據(jù)標注的小公司小工作室如雨后春筍般的遍布全車大大小小的縣城。        但是目前有個有趣的現(xiàn)象,那就是有很多進入數(shù)據(jù)標注行業(yè)做了一段時間的人慢慢的感覺數(shù)據(jù)標注行業(yè)就是個坑?為什么有些人會說數(shù)據(jù)標注就是個坑呢?        其實對與有上述問題認識的人我們認為,這些人多數(shù)都是有于對這個行業(yè)對自身條件的不了解,盲目的開始進入數(shù)據(jù)標注行業(yè)的。為什么我們會這樣說呢?下面就給給大家來分析下到底有哪幾方面的原因:        一、有相當一部分人是聽了朋友或者網(wǎng)上消息說這行很火爆,好做,門檻低,也有一部分人了因此租辦公室買電腦招人,然后就去群里面找分發(fā)項目的人就開張干起來了??蓪嶋H上這些人他們大多數(shù)都沒有充分了解數(shù)據(jù)標注行業(yè),更沒有認真仔細得去調(diào)查分析,到底自己能不能做好一個項目,到底自己能不能有質(zhì)有量按時交付的完成一個項目,到底自己有沒有這個能力來管理項目。更多的人也沒有去用長遠的眼光去考慮數(shù)據(jù)標注項目。        二、數(shù)據(jù)標注項目雖然入門門檻低,但是相當一部分有于理解認知應變能力上都不能保證去做好數(shù)據(jù)標注項目,還有一部分人由于自己對標注項目重視程度不足接到項目之后呢?不仔細認真的去閱讀理解項目規(guī)則,更沒有很好的對規(guī)則質(zhì)檢標準去培訓員工,而對員工的要求主要看重每天的產(chǎn)出效率,從而導致接到手的項目做的質(zhì)量很差,頻繁的返工,有提項目甚至因為質(zhì)量太爛項目方不給結(jié)算或者是結(jié)算比例很少,最終的結(jié)果就是做好些個項目但基本都是賠錢。        三、雖然業(yè)內(nèi)人都 說數(shù)據(jù)標注簡單,但是標注項目他也是一個系統(tǒng)性的工程,一個項目能不能做好并不簡單的看項目好做就能賠錢。實際上決定項目賺不賺錢考驗的是一個團隊的項目管理水平,質(zhì)量管理能力,運營能力各方面因素的。一句話再好賺錢的項目也照樣有人賺錢也有人賺錢,要賺錢不是那么簡單的。        四、還有些工作室 、小公司因為對行業(yè)不夠了解等他們做了一段時間后發(fā)現(xiàn),自己團隊經(jīng)常會沒有項目做,而自己團隊接項目的業(yè)務能力又不具備,甚至有的時候為了員工有活干去接一些價格極低根本就不賺錢的標注項目,時間稍微一長這些工作室團隊就會賠上很多錢最終關(guān)門倒閉。        五、下來要說的就是一部分人人兼職人員由于認識不到位,對項目的規(guī)則質(zhì)量要求 文件不認真閱讀消化理解導致做的項目質(zhì)量差返工有的甚至最后不結(jié)算,最終退出這行。更有一些人由于經(jīng)驗不足被標注行業(yè)的項目騙子給忽悠到辛苦勞動到最后結(jié)算時找不到人。        標注行業(yè)本身由于進入門檻低,做的人很行業(yè)內(nèi)盲目打價格戰(zhàn),導致很多轉(zhuǎn)手二手三手的項目在質(zhì)量工期的要求下根本就不賺錢甚至賠錢,所以在這里也提醒大家做任何事都要謹慎而行。