与亲生子伦中文字幕,国产精品美女久久久久AV爽,人妻夜夜爽天天爽,在线播放无码后入内射少妇

登錄|注冊數(shù)據(jù)標注交流2000人QQ群:489587938客服QQ/微信:670201222

未來人類將被AI取代?

如果說有一項技術(shù)徹底改變了 21 世紀,那一定是人工智能。Google 新掌門人 Sundar Pichai 曾說:“人工智能帶給我們生活和工作的改變,甚至將超過火和電?!彪m然噱頭滿滿,但不可否認的是,人工智能正在翻天覆地的改變著人們的生活方式。以前只有在科幻小說中才能了解到的工具和生活方式正在人工智能的加持下,從各個角度滲透進我們的日常生活,并帶動著技術(shù)進步、產(chǎn)業(yè)升級、推動市場經(jīng)濟整體快速發(fā)展。因此,正確理解人工智能的概念就變得非常重要。本文將幫助你理解人工智能的定義、階段、類型以及研究領(lǐng)域。

人工智能的定義

1956 年,John McCarthy(1927~2011)在達特茅斯會議上提出了“人工智能 (artificial intelligence,AI)”一詞。他將人工智能定義為:

“制造智能機器的科學與工程?!?/p>

‘The science and engineering of making intelligent machines.’

人工智能也可定義為能夠執(zhí)行需要人類智能的任務的計算機系統(tǒng)的開發(fā),如制定決策、檢測對象、解決復雜問題等等。

 

 

人工智能的階段

很多文章都認為,強人工智能(Artificial General Intelligence)、弱人工智能(Artificial Narrow Intelligence)以及超人工智能(Artificial Super Intelligence)是不同類型的人工智能。其實更確切地說,它們是人工智能的三個階段。

弱人工智能(ANI)

弱人工智能,又稱為狹義人工智能。在這一階段,機器并不具備任何思維能力,只是執(zhí)行一組預定義的功能,如語音識別、圖像識別等,是擅長單個方面的人工智能,類似高級仿生學。它們只為解決某一特定具體的任務而存在,大多是統(tǒng)計數(shù)據(jù),從中歸納出模型。比如, AlphaGo 只會下圍棋,并不能執(zhí)行其他任務。

 

 

弱人工智能的例子包括 Siri、Alexa、自動駕駛汽車、AlphaGo、人形機器人 Sophia 等。到目前為止,幾乎所有基于人工智能的系統(tǒng)都屬于弱人工智能。

強人工智能(AGI)

強人工智能,又稱為通用人工智能。不同于弱人工智能,強人工智能可以像人類一樣應對不同層面的問題,而不僅僅只是執(zhí)行一組預定義的功能。不僅如此,強人工智能還具有自我學習、理解復雜理念等多種能力。也正如此,強人工智能的開發(fā)比弱人工智能要困難得多。事實上,人工智能國際主流學界所持的目標也僅局限于弱人工智能。目前很少有人進行強人工智能的研究,也尚未形成相應的成果。

 

 

強人工智能還被許多科學家視為對人類生存的威脅, Stephen Hawking 警告稱:

“完全人工智能(Full Artificial Intelligence)的發(fā)展可能意味著人類文明的終結(jié)……人工智能一旦脫離束縛,會不斷加速重新設計自身。而人類由于受到生物進化的時間限制,無法與之競爭,很可能會被取代?!?/p>

超人工智能(ASI)

當弱人工智能已經(jīng)大部分實現(xiàn),強人工智能正在通過深度學習不斷逼近之時,超人工智能的概念呼之欲出。在這一階段,計算機的能力將超越人類。目前,強人工能智能是電影和科幻小說中描述的一種假想情景:機器已經(jīng)接管世界。

 

 

“人工智能(我指的不是狹義的人工智能)的發(fā)展速度快得令人難以置信。除非你能夠直接接觸到 DeepMind 這樣的組織,否則你根本不會知道人工智能的增長速度有多快——它正以接近指數(shù)級的速度增長。在五年內(nèi)(最多十年)將存在發(fā)生危險事件的風險。"

——Elon Musk

人工智能的類型

當有人讓你解釋不同類型的人工智能系統(tǒng)時,你必須根據(jù)它們的功能進行分類。密歇根州立大學 Arend Hintze 將人工智能分為以下幾種類型:單一反應型、有限記憶型、具有心智型以及自我意識型。

單一反應型(Reactive Machine AI)

這種類型的人工智能是最基本的人工智能系統(tǒng),它僅基于當前數(shù)據(jù)運行的機器,只考慮當前情況。也就是說,反應型機器只能進行反應,它既沒有記憶能力,也無法利用過去的經(jīng)驗來制定現(xiàn)在的決策。

 

 

反應型機器的一個典型例子就是著名的 IBM 國際象棋程序 Deep Blue 。1997 年 5 月,它以 3.5:2.5 的戰(zhàn)績擊敗了世界冠軍 Garry Kasparov,成為首個在標準比賽時限內(nèi)擊敗國際象棋世界冠軍的計算機系統(tǒng)。

Deep Blue 看似擁有人的智慧,實際上,它只關(guān)注棋盤上的現(xiàn)狀,并在可能的走法中作出決策。除了遵守重復棋局不能連續(xù)出現(xiàn)三次的規(guī)定外,和經(jīng)驗豐富的人類不同,它對過去并沒有任何概念。

目前的人工智能,要么對世界沒有概念,要么只對其執(zhí)行的特定任務有極其有限、具體的概念。Deep Blue 的創(chuàng)新之處在于,它放棄了拓寬計算機可能考慮的棋路范圍的這種思路。相反,開發(fā)人員找到了一種方法,讓它縮小自己的“視角”,根據(jù)它對某些走法的結(jié)果進行評估,停止追求一些可能的走法。類似地,AlphaGo 也無法評估所有的走法,但它采用了比 Deep Blue 更為復雜的方法:使用神經(jīng)網(wǎng)絡來評估棋局的走勢。

這種類型的人工智能無法在專業(yè)領(lǐng)域之外發(fā)揮作用,而且容易被愚弄。它們無法通過交互的方式成為世界的組成部分。很顯然,它們只是最基本的人工智能系統(tǒng),并不符合我們對人工智能系統(tǒng)的未來預期,即能夠與人類展開真正的互動,甚至對周圍的環(huán)境作出真實的反應。

有限記憶型(Limited Memory AI)

有限的記憶,顧名思義,指人工智能可以通過研究以往的數(shù)據(jù)作出明智的決策。這種類型的人工智能具有短暫或臨時的記憶,可以用來存儲過去的經(jīng)驗并評估未來的行為。

 

 

自動駕駛汽車就是這種類型的人工智能,它利用最近收集的數(shù)據(jù)作出即時決定。例如,使用傳感器識別過馬路的行人、陡峭的道路以及交通信號等,從而作出更好的駕駛決策,這有助于防止交通事故的發(fā)生。

然而,自動駕駛汽車的歷史信息存在的時間很短暫,無法像經(jīng)驗豐富的人類駕駛員那樣將其存儲在“經(jīng)驗庫”中。這種類型的人工智能,并不能構(gòu)建全面的“表現(xiàn)”(representations),它并不能記住自己的經(jīng)驗,并學會如何應對新的情況。

具有心智型(Theory Of Mind AI)

心智理論,心理學術(shù)語,是人類能夠理解自身及周圍人的心理狀態(tài)的能力。這一理論來源于哲學,進入心理學領(lǐng)域后,慢慢成為認知心理學與神經(jīng)心理學的研究重心之一。心智理論是人類社會形成的關(guān)鍵,通過這一理論,人們可以更好地理解社交、互動的內(nèi)在動力。試想,如果人類不能理解彼此的動機和意圖,那么,相互間的溝通、合作就會變得異常困難,甚至毫無可能。

 

 

這種類型的人工智能較前兩種更為先進,它在心理學中扮演著重要的角色,主要體現(xiàn)在對機器“情商”的開發(fā)上。

如果人工智能系統(tǒng)真的能夠與人類并肩行走,它們就必須能夠明白,每個人都有思想和感受,理解人類預期,并由此調(diào)整自身行為,這正是我們目前的人工智能與未來的人工智能之間的重要差異。

自我意識型(Self-aware AI)

這是人工智能發(fā)展的最后一步:構(gòu)建一套能夠形成自我表征的系統(tǒng)。像 Elon Musk 和 Stephen Hawkings 這樣的天才一直警告我們警惕人工智能的進化。讓我們祈禱,我們永遠不會達到這種人工智能的狀態(tài)。因為,在這種狀態(tài)下,機器將擁有自己的意識,它能夠意識到自我,知道自己的內(nèi)部狀態(tài),還可以預測他人的感受。當前,具有自我意識的人工智能離我們還有很遠的距離。然而在未來,到達超人工智能的階段仍存在可能。

 

 

人工智能的研究領(lǐng)域

人工智能可以通過以下技術(shù)解決現(xiàn)實問題:

機器學習
深度學習
自然語言處理
機器人
模糊邏輯
專家系統(tǒng)

 

 

機器學習

機器學習是一門借助機器解釋、處理和分析數(shù)據(jù)以解決實際問題的科學。它的根源可以追溯到 1952 年就職于 IBM 的 Arthur Samuel(被譽為“機器學習之父”)設計的一款西洋跳棋程序。機器學習有三種類型,分別為監(jiān)督式學習、無監(jiān)督式學習和強化學習。

毫無疑問,機器學習有助于人類克服知識和常識方面的瓶頸,而我們認為這些瓶頸會阻礙人類水平的人工智能的發(fā)展,因此許多人將機器學習視為人工智能的夢想。

想了解有關(guān)機器學習的更多信息,你可以瀏覽以下博客:

Machine Learning Tutorial for Beginners

What is Machine Learning? Machine Learning For Beginners

深度學習

深度學習是在高維數(shù)據(jù)上實現(xiàn)神經(jīng)網(wǎng)絡以獲得洞察力并形成解決方案的過程。深度學習是機器學習的一個高級領(lǐng)域,可以用于解決更高級的問題,它是 Facebook、自動駕駛汽車、Siri、ALexa 等虛擬助手人臉認證算法背后的邏輯。

想了解有關(guān)深度學習的更多信息,你可以瀏覽以下博客:

What is Deep Learning? Getting Started With Deep Learning

Deep Learning Tutorial: Artificial Intelligence Using Deep Learning

自然語言處理

自然語言處理是一門從人類自然語言中提取洞察力,以便與機器交流并發(fā)展業(yè)務的科學。它也是人工智能中最古老、研究最多、要求最高的領(lǐng)域之一。開發(fā)智能系統(tǒng)的任何嘗試,最終似乎都要解決一個問題,即使用何種形式的標準進行交流。例如,比起使用圖形系統(tǒng)或基于數(shù)據(jù)系統(tǒng)的交流,語言交流通常是首選。

20 世紀四五十年代,人們使用有限自動機、形式語法和概率建立了自然語言理解的基礎(chǔ)。但是,20 世紀五六十年代,早期使用機器翻譯語言的嘗試被實踐證明是徒勞無功的。20 世紀 70 年代,當時的潮流趨于使用符號方法和隨機方法。進入 21 世紀后,隨著機器學習的興起,自然語言處理迎來新的突破,并推動了隨機過程、機器學習、信息提取和問答等現(xiàn)有方法的應用。比如,Twitter 使用自然語言處理技術(shù)來過濾推文中的恐怖主義的語言,Amazon 使用自然語言處理了解客戶評論并改善用戶體驗。

機器人

人工智能機器人是在現(xiàn)實環(huán)境中行動的人工智能體,通過采取負責任的行動來產(chǎn)生結(jié)果。這一領(lǐng)域在計

推薦文章

5到10年后,當人工智能全面普及,科技先驅(qū)和新一代商業(yè)巨子注定會被時代的聚光燈銘記。 但今天卻想說一個關(guān)于人工智能“從未被講出”的故事,寫一群時代大幕后的“隱形者”——標數(shù)據(jù)的人。 智能時代滾滾巨輪之下,一批批用于“人臉識別”、“自動駕駛”、“自然語言處理”的標注好的數(shù)據(jù),正是出自這些學歷不高,每天對著電腦工作8到10小時的人手中——他們是“人工智能背后的人工”。經(jīng)過采訪了多個數(shù)據(jù)標注服務商、數(shù)據(jù)標注工作室和數(shù)據(jù)標注者。據(jù)業(yè)內(nèi)人士估計,中國全職的“數(shù)據(jù)標注者”已達到10萬人,兼職人群的規(guī)模則接近100萬。他們中有職高學生,有嘗試過40份工作的聾啞人,有從工地輾轉(zhuǎn)而來的新生代農(nóng)民工……他們源源不斷地為人工智能的發(fā)展供應最重要的“數(shù)據(jù)燃料”——在現(xiàn)有的技術(shù)框架下,數(shù)據(jù)量越大,質(zhì)量越好,算法模型就表現(xiàn)越好??梢哉f,數(shù)據(jù)決定著整個人工智能行業(yè)的發(fā)展態(tài)勢。但標注工作本身是一個勞動密集型工種,收入并不高。隨著技術(shù)的進一步發(fā)展,未來還有被取代的可能。許多數(shù)據(jù)標注者的父輩是參與了中國房地產(chǎn)奇跡的農(nóng)民工。如今,父輩手里的鐵鏟變成了年輕人的鼠標、鍵盤,但和父輩一樣,他們?nèi)允沁吘壵摺T谶@個除夕,他們也像父輩一樣踏上了歸鄉(xiāng)的旅途,不僅是從城市回到鄉(xiāng)村,也是從科技前線回到古老的火爐前。小志從貴陽坐了四小時的大巴回到山區(qū)家中,第一件事就是將錢塞到母親手里; 犇犇給父親買了新的電動剃須刀; 何軍家在河南周口,打算把錢都存著娶媳婦,過年期間就要見幾個相親對象; 小袁想再掙點錢后換一副助聽器,現(xiàn)在這個他已戴了好多年,把他不斷長大的耳蝸磨出了新新舊舊的傷…… 我們無法預判他們的命運,但選擇講出他們的故事。這些科技進步背后的“無名者”值得一次認真的注視。數(shù)據(jù)折疊數(shù)據(jù)折疊人工智能的世界里,存在不為人知的“數(shù)據(jù)折疊”: 一邊是炫酷的科技、神奇的智能應用;一邊是大量人工每天重復地生產(chǎn)機器學習的“食物”——標注好的數(shù)據(jù)。 北京和貴陽,是數(shù)據(jù)標注世界里的兩座“雙子星”城市。北京聚集了大量人工智能公司;貴陽近年來著力發(fā)展“大數(shù)據(jù)戰(zhàn)略”,已擁有相對完整的數(shù)據(jù)服務產(chǎn)業(yè)生態(tài)。 2017年,僅北京中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)規(guī)模就超過700億元;貴陽2017年的大數(shù)據(jù)產(chǎn)業(yè)及其關(guān)聯(lián)產(chǎn)業(yè)規(guī)??偭砍^1500億元。AI行業(yè)的總規(guī)模也在持續(xù)增加,根據(jù)麥肯錫2017年4月發(fā)布的一份報告,到2025年,AI應用的總市場可能達到1270億美元。 但標注數(shù)據(jù)的人,生活在這些巨額數(shù)字之外,拿著不高的工資,活動在“第二空間”。 從三里屯驅(qū)車1小時,行駛30公里,就到了北京郵電大學宏福校區(qū)。這里有北郵和華騰碩博合辦的電子商務培訓班,學生總數(shù)300多人,高峰時期,有120多人參與數(shù)據(jù)標注的兼職項目。 標注工作室占滿了某棟教學樓二層的5個房間,150臺電腦前坐著一群十八九歲的學生,正盯著電腦屏幕給圖片拉框。他們流程化地操作鼠標——這些枯燥的工作,最終將用于熱鬧炫酷的無人駕駛項目。從做數(shù)據(jù)標注的教室窗口向外望,可以看到北郵的教一,那里有國際學院和計算機專業(yè)學生專用的機房。 兼職標數(shù)據(jù)的培訓班學員一個月的收入在2000元左右。如果全職做,人均工資約4000到5000元。而坐在教一的未來算法工程師,剛畢業(yè)時,起薪就可能達到30萬元/年。BasicFinder旗下某數(shù)據(jù)工廠 培訓班學員參與的標注項目,采用了目前數(shù)據(jù)標注行業(yè)的主流模式之一——“外包”。 某數(shù)據(jù)標注主管告訴「甲子光年」,AI數(shù)據(jù)標注的外包市場2011年開啟,2015年真正開始,2016年下半年出現(xiàn)收縮,2017年又有了新一輪的爆發(fā)。 外包盛行,是因為人工智能的發(fā)展需要大量人力對非結(jié)構(gòu)的數(shù)據(jù)進行加工,以用于機器學習。而創(chuàng)業(yè)團隊和巨頭公司,為了集中精力研發(fā)或保持團隊的高學歷占比,很少完全自建數(shù)據(jù)標注團隊。 外包江湖門派眾多、良莠不齊。 從業(yè)者是這樣打招呼的,“你是發(fā)包方還是外包方?” BAT、人工智能創(chuàng)業(yè)公司,學術(shù)團體,以及政府、銀行等機構(gòu)都可能成為發(fā)包方。BAT和人工智能公司需求最大,學術(shù)團體次之,政府、銀行等傳統(tǒng)機構(gòu)的需求最小但有不斷增長的趨勢。某數(shù)據(jù)標注主管告訴「甲子光年」,他目前所接觸到的上述三類業(yè)務需求的比例為7:2:1。 某數(shù)據(jù)標注公司負責人透露,商湯、曠視這類大的人工智能公司,一年在數(shù)據(jù)上的支出有數(shù)千萬。 在“外包方”一端,有 “眾包”和“工廠”兩種模式。前者是把任務通過平臺轉(zhuǎn)接給網(wǎng)民,如“百度眾包”、“京東眾智”、“龍貓數(shù)據(jù)”;后者是自己經(jīng)營團隊,對整個流程進行控制,如貴陽夢動科技經(jīng)營了一個500人的“數(shù)據(jù)工場”;BasicFinder與二十來家“數(shù)據(jù)工廠”有長期業(yè)務合作,少則幾十人,多則兩三百人。而在規(guī)范的機構(gòu)之外,還游離著三五人到十幾人規(guī)模不等的“小作坊”。 許多機構(gòu)在眾包和自營工廠兩方面都有涉足,眾包平臺上也有許多以團隊為單位接單的“公會”。 算法公司和人才多集中在北深杭等科技核心區(qū)域,而作為一個“勞動密集型”的中低收入行業(yè),數(shù)據(jù)標注人員散落三四線城市。 在距離貴陽市中心50公里的百鳥河數(shù)字小鎮(zhèn),有一個規(guī)模500人的“數(shù)據(jù)工場”,500名標注員中,近一半是附近一家扶貧高職“盛華職業(yè)學院”的學生。位于貴陽的“數(shù)據(jù)工場” 他們很珍惜這個接近“白領(lǐng)”的兼職機會,1月能掙到1500元,經(jīng)濟上足以自立,省點還可以補貼家用,相比其他兼職選擇:去餐廳辛苦端盤子或頂著風雨送外賣,數(shù)據(jù)標注相對輕松且體面。 盛華學院大數(shù)據(jù)專業(yè)老師,同時也是貴陽夢動科技人工智能服務部總監(jiān)的曹珊告訴「甲子光年」,她曾帶著七個學生來北京某人工智能公司參加圖像標注培訓,通過后可留下來實習,但競爭激烈,五十九人只留十個,其中不少是北京本地學校的競爭者。最終,這7位來自貴陽的同學都留了下來。 這些年輕的數(shù)據(jù)標注者,一頭連著最前沿的科技,一頭連著他們正在回去的家鄉(xiāng)——那里往往是貧困、閉塞的所在,是科技的影響力最微弱的“第三空間”。 小志是曹珊的學生,數(shù)據(jù)工廠臘月二十七才放假,小志坐了四小時大巴回到山區(qū)的家里,父母都務農(nóng),身體也不好,家里除了房子和田,唯一像樣的財產(chǎn)是一頭牛。 進高職前,小志甚至都沒碰過電腦,唯一會的操作是按開關(guān)鍵。電腦極大地打開了他的世界,但也讓他一度沉迷游戲。最嚴重的時候,課不上了,數(shù)據(jù)不標了,覺也不睡了。 曹珊為此和小志長談了多次,目前小志的生活漸漸步入正軌,成了數(shù)據(jù)標注的小組長,手里帶著十多個同學。 但未來工作前途的不可預期,相對低的收入,較大的家庭負擔,仍然是這些年輕人無法擺脫的苦惱。 父輩的積累相當頑固,無論是財富、聲望,還是貧窮和負擔。父輩與我:從建筑工地到“智能工地”犇犇的人生在某種程度上,是對父親的繼承。 他是西安某數(shù)據(jù)標注工作室的標注員,犇犇和他所在的工作室代表了數(shù)據(jù)標注行業(yè)的另一種典型模式“小作坊”。 今年26歲的犇犇,先后做過廚師、進過工廠、推廣過數(shù)種數(shù)字貨幣,但沒有一份工作做得長久。 犇犇父親在他這個年紀時,是鎮(zhèn)上棉紡站的一名工人。2005年棉紡站關(guān)門,下崗后的父親去甘肅當過兩年鉆井工人,此后一直在做建筑。 直到2017年12月初,犇犇還不知道數(shù)據(jù)標注這個工種。 當時他接到靈的一個電話,邀請他一起做數(shù)據(jù)標注工作室。靈和犇犇曾一起推廣數(shù)字貨幣,行情最好時,一筆交易能拿兩萬提成。但好好的幣,玩著玩著沒了,他們的這次合作鎩羽而歸。 經(jīng)歷上一次失敗后,靈又殺進數(shù)據(jù)標注領(lǐng)域,很快,她組建了15人規(guī)模的工作室,團隊成員都跟犇犇一般大,氛圍很好,他們常常一邊標數(shù)據(jù),一邊聊天,時間并不難熬。 最難受的是眼睛。從早上九點到晚上六點,工作內(nèi)容就是盯著屏幕給圖片拉框。拉框要求十分精細,偏差絲毫都不行。犇犇眼睛干澀時,會起身去樓道抽煙。犇犇所在的工作室 眼睛的難受熬熬就能過去,更愁人的是工資不高。 犇犇笑著說,入不敷出啊。他在供一套鄭州的房子,每個月要還4700的房貸,而工資撐死就五六千。 在犇犇看來,這份工作也沒什么前途:“跟電子廠一樣,多做多得?!?犇犇的夢想是在全國開很多養(yǎng)老院,因為小時候的鄰居是獨居的七十歲老人,“沒人養(yǎng)很可憐”。 但開養(yǎng)老院對現(xiàn)在的犇犇來說太難了,他養(yǎng)自己都難。 數(shù)據(jù)標注的晉升之路只有兩條,每條都是窄門: 要么進數(shù)據(jù)公司,爬完標注員-標注組長-數(shù)據(jù)經(jīng)理-數(shù)據(jù)總監(jiān)這個鏈條,層層打怪升級;要么進人工智能公司當數(shù)據(jù)標注員,然后憑借超人毅力自學技術(shù)曲線救國。 前一條路不需要學歷,但是千百人過獨木橋,且依舊是在數(shù)據(jù)標注圈子里打轉(zhuǎn);后一條路能真正學到東西,但對學歷有要求。 犇犇只有高中學歷,連高考都沒參加。因為不愿再讀書,他跟父親起過很大爭執(zhí),父親深知打工有多苦。高三的那個暑假,犇犇也去體驗了一把:跟著父親去工地上搬磚。 現(xiàn)在,他成了一名“智能工地”上的新型“搬磚者”。 對科技、社會和自身的關(guān)系,如今犇犇有清醒的認知:“人工智能就像是一個孩子,標注好的圖片就像是孩子的食物,而我們就是制作食物的人,最苦最累的我們做了,成名的只是那些制造孩子的人?!睜臓恼f。 兩代人的命運在此重疊。 農(nóng)民工一磚一瓦壘起了實體城市的高樓;數(shù)據(jù)標注者一框一線搭建起了算法的智能。前者是城市的邊緣者,高樓起來了,他們?nèi)允沁吘壵?;后者是科技世界的邊緣者,機器變聰明了,他們還是邊緣者。 犇犇會最終棲居在數(shù)據(jù)標注這份工作上嗎?他給的答案是不確定的,他不知道這份工作是否不出幾年就被取代,也不知道自己是否就此乖乖認命。 中國有五千多萬的農(nóng)民工以建筑為生,到了五六十歲還在工地上忙碌。數(shù)據(jù)標注的市場才剛打開,「甲子光年」從從業(yè)者口中得知,截止2018年年初,以數(shù)據(jù)標注為生的全職標注員規(guī)模達近十萬,這個數(shù)字未來會繼續(xù)增長,未來將達數(shù)十萬。數(shù)字標注也將成為新生代農(nóng)民工的聚集地。野蠻生長,坑與機會并存相比聚光燈之下的人工智能科技公司,數(shù)據(jù)標注行業(yè)是個在暗處的行業(yè),存在大量灰色地帶。 作為一個勞動密集型行業(yè),進入門檻并不高,壓低“成本”、“薄利多量”,就成了許多團隊的競爭手段。 許多公司招的標注員都是沒有交五險一金的臨時工。7、8萬的啟動資金,就可以在四五線小城組起一個“工作室”。 AI公司也傾向壓低成本——某數(shù)據(jù)標注公司主管告訴「甲子光年」,部分人工智能公司對數(shù)據(jù)標注的重視不夠,過分壓低預算,把項目外包給一些不靠譜的團隊;這些團隊做不完、做不了,又會把任務轉(zhuǎn)包給另一些小團隊,或重新找到大的數(shù)據(jù)標注公司,使質(zhì)量和交期都無法保證。 “低價競爭和行業(yè)不規(guī)范導致的層層外包是行業(yè)的噩夢?!本〇|眾智平臺的負責人李工告訴「甲子光年」。 對小團隊來說,外包直接折損了利潤。 做過室內(nèi)裝修的何軍,在2017年底投入十萬積蓄作為啟動成本,在河南周口成立了一個40人團隊的數(shù)據(jù)工作室。他2018年的最大計劃,就是“爭取接到一手項目”。 “利潤其實不高”,何軍一邊抖著腿,一邊掰著手指頭細細算賬,“你看啊,一個拉框平均4分錢,一個員工一天能做大約4500個,一共180塊。過關(guān)率90%,再除去審核的成本,再給每個標注員每天發(fā)110元左右的工資,平均下來工作室每天也就從每個人身上賺30塊吧?!焙诬姷谝粋€月虧了本,第二個月勉強持平。 “開年就去跑工商注冊,然后一家家聯(lián)系大公司,得接到一手項目,給員工的多發(fā)點工資,現(xiàn)在太低了。”何軍說。 小團隊只能接二手甚至是好幾手的項目,一手項目就像江湖傳說,聽過沒見過。 處境相似的趙聰也特別想接到一手項目。他是2017年10月入場的標注者,自己攢了三個人的團隊兼職做數(shù)據(jù)標注?!拔覀兊捻椖慷际菑男」臼掷锝拥?,連發(fā)包方的名字都不知道”,趙聰說,“利潤很低”,三個人,三個月,三個項目,每人也就獲得了一千塊收入。 大平臺也反感層層外包,因為這嚴重擾亂行業(yè)秩序。 “數(shù)據(jù)標注看起來門檻很低,但其實管理的門檻并不低。價格、產(chǎn)能、交期和質(zhì)量都要兼顧。很多小團隊,拿到的項目自己消化不了,最后又會找到我們?!盉asicFinder的杜霖說。 而針對一些特定的復雜任務,還需要進行足夠的培訓,有的培訓期需要1到3個月。在理解客戶需求、保證數(shù)據(jù)的多樣性、隨機性上,許多小團隊也欠缺必要的能力。 層層外包,對數(shù)據(jù)標注員的直接影響是:攤薄了收入,錢被中間環(huán)節(jié)分掉:一手的項目在誰手上,價格多高,會經(jīng)歷多少層級,每層有多少利潤,都是謎。 還有另一個角色在攪亂這趟渾水——代理人。 代理人說白了就是拉項目跑活兒的人,關(guān)系戶,是中國人情社會里長出的變量。一些小公司會高薪養(yǎng)代理人,以期打通關(guān)鍵節(jié)點。 趙聰無奈地說,“靠關(guān)系吃飯的社會”,最末端的標注者最缺這種關(guān)系資源。 杜霖認為,這個行業(yè)經(jīng)歷了早期的瘋狂生長,最終一定會經(jīng)歷一番洗牌,變得更為規(guī)范化、透明化。屆時質(zhì)量會取代成本,成為需求方最優(yōu)先考慮的變量:“人工智能公司的本質(zhì)需求是能找到靠譜團隊。大家最后都會明白,背著抱著一邊沉,想省的錢都省不掉,要保證質(zhì)量,就是一分錢一分貨。 ”大浪淘沙,有兩類機構(gòu)會最終留下來:注重質(zhì)量及服務的中小型數(shù)據(jù)標注公司,以及自有整套數(shù)據(jù)技術(shù)的平臺。 而犇犇、何軍以及趙聰都有可能被行業(yè)清洗出去。還有5年,只有5年經(jīng)營小工作室的何軍已經(jīng)開始緊張了,他聽說算法升級后,將不再需要大量人工標注。由于對技術(shù)動向缺乏把握,他時常處于一種對未來的不安之中。 杜霖則認為,至少在5年內(nèi),數(shù)據(jù)標注行業(yè)的增長空間還很大,數(shù)據(jù)標注的市場才剛打開,數(shù)據(jù)需求將緊隨人工智能的大規(guī)模落地引來一波爆發(fā)式增長。 首先,人工智能行業(yè)本身的發(fā)展,將進一步帶動數(shù)據(jù)標注行業(yè)。目前能被建模量化的數(shù)據(jù)只占真實世界中的極少一部分?,F(xiàn)有的數(shù)據(jù)標注業(yè)務主要集中在安防和自動駕駛領(lǐng)域,未來,隨著AI深入更多垂直行業(yè),新需求將不斷出現(xiàn)。 何軍告訴我們,前些天就出現(xiàn)了一個他沒見過的標注內(nèi)容,北航的學生找上門來,要對“積云”進行標注。杜霖也跟我們分享,他們做過一個很有意思的標注項目——標注指甲區(qū)域,因為客戶要做美甲機器人。 其次,在現(xiàn)有的主流“有監(jiān)督學習”的算法模型下,為了讓算法有更高的準確率,數(shù)據(jù)不嫌多。Google的技術(shù)大牛Jeff Dean曾在一次公開課上展示一個海量數(shù)據(jù)的訓練結(jié)果,如下圖所示:橫軸代表數(shù)據(jù)規(guī)模,縱軸代表準確率,藍線是深度神經(jīng)網(wǎng)絡算法,綠線是傳統(tǒng)訓練方法。 可以看到,藍線的準確率和數(shù)據(jù)規(guī)模及質(zhì)量持續(xù)成正比,并沒有出現(xiàn)趨于平滑的拐點,這說明深度學習對數(shù)據(jù)有源源不斷的需求。第三,從感知智能到認知智能的跨越,需要的數(shù)據(jù)維度會更大,這可能催生更精細的數(shù)據(jù)標注需求——如對一段對話數(shù)據(jù)的標注,不僅要知道對話內(nèi)容、語義,可能還需要標注談話者身份、情緒變化等。 杜霖告訴我們,人工智能公司的總支出中,目前有20%-30%用于數(shù)據(jù),現(xiàn)階段大陸市場數(shù)據(jù)采集及標注的規(guī)模保守估計有五十億。一個參考是,新三板上市公司數(shù)據(jù)堂2016年的營收達到了9680萬元人民幣。 京東眾智平臺的負責人李工對未來也很樂觀,他認為,包括采集、標注、清洗等流程的數(shù)據(jù)市場未來將達上百億。 但這一切都是基于“有監(jiān)督學習”這個大前提。行業(yè)的一個變量是,如果算法從“有監(jiān)督學習”升級為無監(jiān)督學習、強化學習或遷移學習,數(shù)據(jù)標注需求將大大減少。 技術(shù)進步和躍升自有其規(guī)律,目前無監(jiān)督學習等新算法仍然只是學界的探索,尚不能用在大規(guī)模的商業(yè)落地中。 杜霖判斷,新的革新性算法,至少5年內(nèi)都不會出現(xiàn)。Novumind創(chuàng)始人吳韌此前接受專訪時則認為,深度學習加大數(shù)據(jù)就是人工智能的“way to go”,較難出現(xiàn)顛覆性的其他路徑。 5年,對公司來說是一個可以布局、掉頭的“窗口期”。京東眾智的李工告訴我們,他們應對變化的策略是輕運營和“產(chǎn)品化”,著力研發(fā)加速AI落地速度的Pre-A.I.產(chǎn)品,并同時研發(fā)平臺技術(shù),做到“數(shù)據(jù)與流程分離架構(gòu)”。數(shù)據(jù)標注本身不是他們的核心戰(zhàn)略。BasicFinder也有類似布局,他們希望一手對接垂直行業(yè)里的數(shù)據(jù)生產(chǎn)者,一手對接上游的算法模型公司,共同推進AI的行業(yè)落地。 但對數(shù)據(jù)標注者個體來說,5年后,也許就不得不面臨再一次“失業(yè)”。到時,他們還能跟隨時代的腳步騰挪轉(zhuǎn)移嗎?燙手的小袁小袁暫時想不到5年后那么長久的事。 作為一名換過40份工作的聾啞人,他很慶幸,終于在“數(shù)據(jù)標注”領(lǐng)域成了“有用的人”。 小袁是京東眾智平臺上“靜公會”的聾啞人標注員,這個公會全部由聽障人士組成。 先后在餐廳、奶粉廠打工的小袁,總是因為無法避險、難以溝通被辭退:“我是燙手的小袁,因為我是聾啞人,所以我總是會燙到身邊的人,被扔出很遠很遠。”相比過去的工作,數(shù)據(jù)標注的安全性更高,但也需要相互溝通。 杜霖和殘疾人群體深入交流后發(fā)現(xiàn),聾啞人的世界里多為名詞、缺乏形容詞,比如要向他們解釋這根線標得不“直”,就會比較費勁。由于輸入信號會被擋掉一半,所以聾啞人接受速度只有健全人的三分之一到五分之一。健全人一周能搞定的培訓,聾啞人要花三周或更久。 但是他們的優(yōu)點是專注、較勁兒、對視覺信號敏銳,數(shù)據(jù)標注行業(yè)對他們來說是機會。 齊工是京東眾智平臺的培訓講師,幾乎每天都去給小袁和工友講課。齊工說,“想當把英雄,承擔更多的責任?!饼R工給聾啞人培訓,左一為齊工,右一為小袁 第一次,他們在工作中找到了歸屬感。像小袁這樣的聾啞人在眾智平臺上還有一千多名,京東為他們成立專門的“靜公會”,項目上優(yōu)先照顧。全職每月有三四千收入,兼職每月有一千以上收入。 杜霖手下也有三個殘疾人團隊,總共約80人。杜霖和京東負責人都表示,愿意為更多殘疾人提供工作機會。 在數(shù)據(jù)標注這份職業(yè)消失之前,這里是他們的家。其中的少數(shù)人,也許能通過轉(zhuǎn)型為數(shù)據(jù)質(zhì)檢者,獲得更長期的職業(yè)生涯。杜霖將公司取名為BasicFinder, 初衷是找到人工智能世界中最本真的一層關(guān)系——數(shù)據(jù)。新生代農(nóng)民工和聾啞人,投身于數(shù)據(jù)標注這份工作中,也是希望找到最本真的生活。他們的要求很樸實,用犇犇的話來講是:有一份穩(wěn)定的工作,有一個幸福的家庭。但科技的發(fā)展,必將帶來智能升級,也使整個行業(yè)更加規(guī)范化。這有點像武士的悖論:武士存在是為了消滅敵人,但是消滅了敵人武士也就失去了存在的理由,這個意義上,他們是在消滅自己。數(shù)據(jù)標注者的工作是幫機器更好的學習,促進人工智能行業(yè)的發(fā)展,而當行業(yè)發(fā)展到一定階段,可能將不再需要如此眾多的人工標注。其實整個人工智能的發(fā)展歷程也有點像“孤獨的武士”:人類發(fā)明了機器,到頭來機器很可能取代大部分人工,甚至是“發(fā)明者”本人。但是,是武士,就必須去消滅敵人。對知識的無限追求既是人類的天賦也是人類的危險,它早已深藏于我們的基因之中,呼喚我們不斷逼近未知邊界。更高的智能一定會到來,認知差距將取代財富差距成為最顯著的人群劃分標準——那可能是一種更無形的“折疊”。未來,當我們真正享受智能帶來的各種便捷時,歷史會遺忘這些人工智能領(lǐng)域的“首批工人”嗎?這可能是除了技術(shù)水平之外,判斷那個未來是好是壞的更重要的標準。

熱門文章

        對數(shù)據(jù)標注行業(yè)稍微有些了解的人都知道數(shù)據(jù)標注進入門檻低,適合很多人兼職也適合創(chuàng)業(yè)。        正是因為數(shù)據(jù)標注行業(yè)的門檻低這個特點最近兩年從事數(shù)據(jù)標注的小公司小工作室如雨后春筍般的遍布全車大大小小的縣城。        但是目前有個有趣的現(xiàn)象,那就是有很多進入數(shù)據(jù)標注行業(yè)做了一段時間的人慢慢的感覺數(shù)據(jù)標注行業(yè)就是個坑?為什么有些人會說數(shù)據(jù)標注就是個坑呢?        其實對與有上述問題認識的人我們認為,這些人多數(shù)都是有于對這個行業(yè)對自身條件的不了解,盲目的開始進入數(shù)據(jù)標注行業(yè)的。為什么我們會這樣說呢?下面就給給大家來分析下到底有哪幾方面的原因:        一、有相當一部分人是聽了朋友或者網(wǎng)上消息說這行很火爆,好做,門檻低,也有一部分人了因此租辦公室買電腦招人,然后就去群里面找分發(fā)項目的人就開張干起來了??蓪嶋H上這些人他們大多數(shù)都沒有充分了解數(shù)據(jù)標注行業(yè),更沒有認真仔細得去調(diào)查分析,到底自己能不能做好一個項目,到底自己能不能有質(zhì)有量按時交付的完成一個項目,到底自己有沒有這個能力來管理項目。更多的人也沒有去用長遠的眼光去考慮數(shù)據(jù)標注項目。        二、數(shù)據(jù)標注項目雖然入門門檻低,但是相當一部分有于理解認知應變能力上都不能保證去做好數(shù)據(jù)標注項目,還有一部分人由于自己對標注項目重視程度不足接到項目之后呢?不仔細認真的去閱讀理解項目規(guī)則,更沒有很好的對規(guī)則質(zhì)檢標準去培訓員工,而對員工的要求主要看重每天的產(chǎn)出效率,從而導致接到手的項目做的質(zhì)量很差,頻繁的返工,有提項目甚至因為質(zhì)量太爛項目方不給結(jié)算或者是結(jié)算比例很少,最終的結(jié)果就是做好些個項目但基本都是賠錢。        三、雖然業(yè)內(nèi)人都 說數(shù)據(jù)標注簡單,但是標注項目他也是一個系統(tǒng)性的工程,一個項目能不能做好并不簡單的看項目好做就能賠錢。實際上決定項目賺不賺錢考驗的是一個團隊的項目管理水平,質(zhì)量管理能力,運營能力各方面因素的。一句話再好賺錢的項目也照樣有人賺錢也有人賺錢,要賺錢不是那么簡單的。        四、還有些工作室 、小公司因為對行業(yè)不夠了解等他們做了一段時間后發(fā)現(xiàn),自己團隊經(jīng)常會沒有項目做,而自己團隊接項目的業(yè)務能力又不具備,甚至有的時候為了員工有活干去接一些價格極低根本就不賺錢的標注項目,時間稍微一長這些工作室團隊就會賠上很多錢最終關(guān)門倒閉。        五、下來要說的就是一部分人人兼職人員由于認識不到位,對項目的規(guī)則質(zhì)量要求 文件不認真閱讀消化理解導致做的項目質(zhì)量差返工有的甚至最后不結(jié)算,最終退出這行。更有一些人由于經(jīng)驗不足被標注行業(yè)的項目騙子給忽悠到辛苦勞動到最后結(jié)算時找不到人。        標注行業(yè)本身由于進入門檻低,做的人很行業(yè)內(nèi)盲目打價格戰(zhàn),導致很多轉(zhuǎn)手二手三手的項目在質(zhì)量工期的要求下根本就不賺錢甚至賠錢,所以在這里也提醒大家做任何事都要謹慎而行。