人工智能技術(shù)有哪些應(yīng)用？人工智能技術(shù)會對未來產(chǎn)生什么影響

2020-07-10 14:34:52|

來源：電子說作者：

需要明確的是，每種類型的人工智能技術(shù)都代表廣泛的類別，通常包括數(shù)十個甚至數(shù)百個基礎(chǔ)組件。反過來，通常將這些組件重組為更復(fù)雜的應(yīng)用程序，為企業(yè)創(chuàng)造價值。

例如，百貨商店人工智能機(jī)器人可以在工作中使用圖像識別、視頻和語音識別技術(shù)。圖像識別軟件將使其能夠檢查貨架上庫存的位置、價格和數(shù)量;視頻將幫助其避免遇到任何障礙，并確定其在商店中的位置;語音識別組件將使其能夠引導(dǎo)和娛樂客戶。

為了取得這種成就，這些業(yè)務(wù)中的人工智能技術(shù)通常結(jié)合了針對整個任務(wù)的特定部分量身定制的各種算法和技術(shù)。它們包括符號處理、統(tǒng)計分析、神經(jīng)網(wǎng)絡(luò)等等。

人工智能技術(shù)有哪些應(yīng)用？

以下是對五種人工智能技術(shù)的深入闡述，這些技術(shù)隨著時間的推移而發(fā)展，從而極大地改變了企業(yè)處理、分析和生成數(shù)據(jù)的方式。

1.圖像識別

企業(yè)使用圖像識別的各種方式包括：在工廠生產(chǎn)線上進(jìn)行自動檢查，在保險中生成損壞估計，在圖像中識別物體，對人員進(jìn)行計數(shù)，控制制造過程，檢測諸如顧客進(jìn)入商店等事件以及生成真實世界的模型。

人工智能技術(shù)必須找到一種方法，采用各種人工智能算法可以處理的數(shù)字來描述世界。在視覺方面，研究人員發(fā)現(xiàn)了如何將一張圖片劃分成一個像素網(wǎng)格，這樣每個像素都可以表示為一個數(shù)字。在早期，采用一個數(shù)字來描述每個像素的亮度。后來，人們發(fā)現(xiàn)可以用三個或更多的數(shù)字來描述每個像素中不同顏色的亮度。

20世紀(jì)60年代，研究人員開始探索如何使用原始形式的光學(xué)字符識別(OCR)技術(shù)的軟件圖像識別功能來識別數(shù)字文檔中的字符。其他研究人員開始探索基于圖像的場景解釋技術(shù)，試圖從二維圖像重建三維圖像。多年來，這些技術(shù)已成為機(jī)器視覺行業(yè)工具包的一部分。

后來，研究人員發(fā)現(xiàn)可以將圖像識別組織為一個分層過程，以使其更易于解釋日益復(fù)雜的現(xiàn)象。例如，黑色和白色像素可能被識別為線條和曲線，而線條和波浪形又被識別為數(shù)字的一部分。訓(xùn)練算法來學(xué)習(xí)基于這些曲線圖案而不是每個像素的亮度來解釋字符的方法要容易得多。類似地，更容易根據(jù)圖像是否包含兩只眼睛和適當(dāng)形狀的耳朵來確定圖像是否是貓，而不是根據(jù)每個像素中顏色的原始亮度來確定。

這種處理方式有望推進(jìn)圖像識別領(lǐng)域。然而直到2012年左右，隨著AlexNet(一種設(shè)計用于支持圖像識別的八層卷積神經(jīng)網(wǎng)絡(luò))的發(fā)展，研究人員才發(fā)現(xiàn)如何擴(kuò)大這個過程以識別成千上萬種不同類型的物體。

諸如AlexNet之類的深度學(xué)習(xí)技術(shù)的優(yōu)點在于，該模型可以自動學(xué)習(xí)以不需要人類以編程方式指定每個步驟的方式來執(zhí)行各種圖像識別任務(wù)。研究人員指出了如何將神經(jīng)網(wǎng)絡(luò)應(yīng)用于不同類型的問題，該功能也促進(jìn)了深度學(xué)習(xí)在其他類型的應(yīng)用程序中的使用。

如今，圖像識別用于識別貨架上的產(chǎn)品、圖片或視頻中的人物，生產(chǎn)流水線上的缺陷以及自動駕駛汽車在街道上遇到的物體。隨著冠狀病毒疫情的出現(xiàn)，很多企業(yè)正在開發(fā)應(yīng)用程序以監(jiān)視社交距離的規(guī)則。

對于企業(yè)領(lǐng)導(dǎo)者來說，一個關(guān)鍵的見解是，通常有可能通過在應(yīng)用程序中使用多種類型的圖像識別來創(chuàng)造更多的價值。例如，智能文檔處理和文檔智能結(jié)合了一組人工智能技術(shù)，其中包括自然語言處理和機(jī)器學(xué)習(xí)，以捕獲難以識別的格式中的數(shù)據(jù)并將其分類。與光學(xué)字符識別(OCR)結(jié)合使用，智能文檔處理可以分析文檔的視覺布局，以確定哪個部分代表產(chǎn)品、發(fā)票金額或銷售條款，并將該信息提供給其他業(yè)務(wù)應(yīng)用程序。

值得注意的是，企業(yè)中大多數(shù)圖像識別應(yīng)用程序都是高度場景相關(guān)的。供應(yīng)商和研究人員經(jīng)常宣傳新的圖像識別改進(jìn)，例如在識別腫瘤方面擊敗了醫(yī)學(xué)專家的軟件。但是在實踐中，僅當(dāng)圖像以正確的角度捕獲時，人工智能才可以使用一組特定的設(shè)備來處理這些放射線圖像，而人類則善于分析從許多不同角度捕獲的各種圖像。

研究人員還發(fā)現(xiàn)，在這些圖像識別應(yīng)用程序的一些實現(xiàn)中也潛藏著偏見。為了減少偏見，專家建議對這些應(yīng)用程序進(jìn)行數(shù)據(jù)訓(xùn)練，這些數(shù)據(jù)代表將要處理的特定類型的圖像。

2.語音識別

需要多種算法將語音轉(zhuǎn)換為文本并準(zhǔn)備進(jìn)行數(shù)字處理。盡管語音識別系統(tǒng)變得越來越好，但是即使是當(dāng)今最好的語音識別系統(tǒng)也仍然容易出錯，因此在安全關(guān)鍵型應(yīng)用(例如醫(yī)療數(shù)據(jù)捕獲)中需要進(jìn)行一些驗證。

貝爾實驗室的研究人員于1952年開發(fā)了首個用于識別單個數(shù)字的語音識別系統(tǒng)。到1962年，IBM公司推出了Shoebox機(jī)器，該機(jī)器可以理解16個單詞。到1980年代中期，研究人員開始使用統(tǒng)計技術(shù)(例如隱馬爾可夫模型)來開發(fā)可以理解2萬個單詞的應(yīng)用程序，但其單詞之間會有停頓。第一款消費(fèi)者聽寫產(chǎn)品Dragon Dictate于1990年發(fā)布，可以根據(jù)語音自動鍵入文字。然后，AT&T公司推出了一種語音識別應(yīng)用程序，該程序無需人工即可路由呼叫。這些早期的系統(tǒng)或者具有適合特定環(huán)境的小型詞匯表，需要由單個聲音進(jìn)行大量訓(xùn)練。

研究人員從2010年開始發(fā)現(xiàn)了將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音識別的方法。這一增長的主要推動力之一是需要找到更好的方法來代表不同類型智能音箱的聲音特征。這要求探索出更好的方法，將原始音頻數(shù)據(jù)轉(zhuǎn)換為人類習(xí)慣于收聽的獨(dú)特聲音(稱為音素)(例如，“汽車”一詞中的“c”)。

研究人員還將基本的語音識別結(jié)果與更好的場景結(jié)合起來，以區(qū)分同音異義詞(bear/bare)。云計算服務(wù)現(xiàn)在提供了各種核心的語音轉(zhuǎn)文本服務(wù)，開發(fā)人員隨后將其融入各種企業(yè)工作流程中。

基本的語音識別功能通過云計算服務(wù)(如微軟Cortana、谷歌Now和蘋果Siri)嵌入到現(xiàn)代智能手機(jī)和電腦中。亞馬遜公司利用語音識別技術(shù)推出了一種新的方式，通過Alexa語音服務(wù)在智能手機(jī)之外連接互聯(lián)網(wǎng)。這些服務(wù)通常在云平臺中完成繁重的工作。最近，谷歌公司通過開發(fā)更有效的算法來提高標(biāo)準(zhǔn)，這些算法可以在其Pixel手機(jī)上本地運(yùn)行語音識別應(yīng)用程序。

語音識別技術(shù)在企業(yè)中的使用正在增加。一些供應(yīng)商還開始開發(fā)用于自動記錄電話會議和現(xiàn)場會議的應(yīng)用程序，以達(dá)到合規(guī)目的或更好地記錄決策過程。自動化語音識別還可以幫助監(jiān)視呼叫中心的活動，以確保工作人員遵循正確的程序，從而使管理人員不必聽到每個呼叫。語音識別應(yīng)用程序也正用于為國際旅行者自動進(jìn)行語言翻譯。這項人工智能技術(shù)的其他商業(yè)應(yīng)用包括家庭自動化、視頻游戲交互以及將視頻編入索引的自動隱藏式字幕。

3.聊天機(jī)器人

對話式人工智能技術(shù)允許應(yīng)用程序以自然的方式與人類交互。第一個聊天機(jī)器人Eliza于1964～1966年在MIT人工智能實驗室開發(fā)。最早的聊天機(jī)器人在詞匯量和可以允許的交互類型方面受到限制。這些應(yīng)用程序使用決策樹，該決策樹根據(jù)查詢或用戶對問題的答案沿各種路徑進(jìn)行操作。在20世紀(jì)80年代到90年代，這些技術(shù)擴(kuò)展到了自動電話應(yīng)用程序，在其中，通過使用IVR技術(shù)的撥號音響應(yīng)或簡單詞匯來控制交互。

最近，由于用于解釋和響應(yīng)文本查詢的更好的自然語言處理技術(shù)，以及與其他服務(wù)的更好集成，使得企業(yè)能夠更容易地自動設(shè)置能夠響應(yīng)常見問題的聊天機(jī)器人，聊天機(jī)器人的應(yīng)用程序激增，接受命令或自定義對給定用戶的響應(yīng)。最近聊天機(jī)器人可應(yīng)用程序的一個關(guān)鍵見解是開發(fā)用于表示用戶意圖和適當(dāng)響應(yīng)的應(yīng)用程序編程框架。

面向外部的聊天機(jī)器人可以幫助實現(xiàn)客戶交互的許多方面的自動化。它們還允許企業(yè)以一種更具吸引力的方式跨各種社交媒體渠道(例如Facebook)進(jìn)行推廣。

企業(yè)的應(yīng)用程序開發(fā)和部署方面已經(jīng)看到了使用聊天機(jī)器人技術(shù)的爆炸式增長，該技術(shù)將聊天機(jī)器人與可自動配置應(yīng)用程序和基礎(chǔ)設(shè)施并生成報告的操作工具結(jié)合在一起。聊天機(jī)器人集成使團(tuán)隊可以記錄其流程，從而更輕松地應(yīng)對重復(fù)出現(xiàn)的問題，或者確定過去特定流程的執(zhí)行方式。

聊天機(jī)器人工具開始進(jìn)入業(yè)務(wù)的其他方面，以幫助記錄部門內(nèi)部或部門之間的各種通信，特別是隨著越來越多的公司采用Slack和MicrosoftTeams等消息傳遞應(yīng)用程序。財務(wù)部門可以使用聊天機(jī)器人來生成和跟蹤重要業(yè)務(wù)指標(biāo)的狀態(tài)。銷售團(tuán)隊可以使用聊天機(jī)器人收集有關(guān)關(guān)鍵客戶的數(shù)據(jù)。

聊天機(jī)器人還可以幫助促進(jìn)其他類型的內(nèi)部交互。例如，員工可能會詢問人力資源聊天機(jī)器人，以詢問有關(guān)其福利狀態(tài)的問題或要求休假。企業(yè)還使用聊天機(jī)器人來自動化與IT系統(tǒng)管理的交互，以處理簡單問題或自動分類更復(fù)雜的問題。

4.自然語言的產(chǎn)生

隨著數(shù)據(jù)量的增長，可能很難為員工或客戶確定正確的信息優(yōu)先級。自然語言生成(NLG)應(yīng)用程序可以幫助查找、組織和總結(jié)給定用戶的最適當(dāng)見解。

根據(jù)業(yè)務(wù)用例的不同，這種人工智能技術(shù)有不同的風(fēng)格。自然語言生成開始作為商業(yè)智能和分析應(yīng)用程序的前端添加，作為Gartner公司創(chuàng)造的一個新的應(yīng)用程序類別的一部分。這些技術(shù)結(jié)合了解釋純文本查詢和生成純英語分析的適當(dāng)摘要的能力。例如，美國航空航天局(USAA)構(gòu)建了一個自然語言生成(NLG)應(yīng)用程序，以改進(jìn)它向商業(yè)用戶提供的關(guān)于不同保險產(chǎn)品銷售情況的答案。

這種人工智能技術(shù)的另一個特點是改進(jìn)了向用戶展示產(chǎn)品信息的方式。在這些類型的應(yīng)用程序中，自然語言生成引擎可以根據(jù)用戶的偏好自定義產(chǎn)品的描述。例如，可能會向更多的技術(shù)用戶深入介紹諸如新手機(jī)耳機(jī)之類的產(chǎn)品的技術(shù)特性，而會向注重時尚的買家提供有關(guān)其外觀和感覺的審美描述。自然語言生成(NLG)還可以幫助改善將內(nèi)容翻譯到新市場的方式。

Trulia公司正在使用自然語言生成(NLG)自動生成用于房地產(chǎn)列表的社區(qū)描述。自然語言生成(NLG)還被用于為美聯(lián)社制作基本的新聞文章。Esquire Singapore公司甚至精心制作了一本特刊，里面刊載了人工智能應(yīng)用的故事。然而，這項人工智能技術(shù)還處于起步階段，專家提醒企業(yè)和醫(yī)療等關(guān)鍵任務(wù)應(yīng)用需要新型的質(zhì)量控制。

盡管如此，企業(yè)仍可能會受益于自然語言處理框架的各種最新改進(jìn)。新的自然語言處理指標(biāo)正在出現(xiàn)，以幫助企業(yè)評估給定框架的效用并改善自然語言生成(NLG)應(yīng)用程序的這些實現(xiàn)。

5.情緒分析

人們在撰寫有關(guān)事件、品牌、政客和其他事物的文章時，通常會表達(dá)出不同的情感類型和強(qiáng)度。情緒分析領(lǐng)域始于20世紀(jì)50年代，當(dāng)時市場營銷人員分析了書面文件的語氣。但這是一個非常人工的過程。不過，現(xiàn)在幾乎每個人都在社交媒體、博客、新聞評論、評論、支持論壇和與公司的通信中留下了情感的數(shù)字痕跡。

包括自然語言處理、機(jī)器學(xué)習(xí)和統(tǒng)計在內(nèi)的各種人工智能技術(shù)都用于分析這些數(shù)字足跡的情感基調(diào)。這些工具有助于跟蹤產(chǎn)品或服務(wù)的更改如何影響客戶，而無需直接詢問人們。它也有助于密切關(guān)注競爭對手的產(chǎn)品和活動。

情緒分析的另一個用例可以識別所謂的品牌影響者，從而使企業(yè)與個人建立更牢固的關(guān)系，他們可以就如何改善服務(wù)或產(chǎn)品提供更好的建議。

情緒分析還可以幫助確定有關(guān)客戶或潛在客戶可能感興趣的事物的重要趨勢，以便企業(yè)可以改善其當(dāng)前產(chǎn)品或創(chuàng)建新產(chǎn)品以滿足這些需求。企業(yè)還可以使用情緒分析來確定其品牌可能受損的特定原因，例如等待時間長、質(zhì)量差或構(gòu)思不佳。

企業(yè)在內(nèi)部也在業(yè)務(wù)中使用這項人工智能技術(shù)來幫助理解和提高員工的士氣和福利。在這個用例中，情緒分析可以分析員工的職位，以幫助理解重要的問題或管理人員的變化可能對他們產(chǎn)生的影響。

更復(fù)雜的情感分析應(yīng)用程序使用人工智能來理解聲音和面部表情所傳達(dá)的情感。該分析可以幫助識別支持電話期間的情緒變化，或評估顧客對商店貨架上新產(chǎn)品的看法。Netflix甚至嘗試使用面部表情情感分析來改進(jìn)電影預(yù)告片。然而，一些研究人員警告說，情緒分析的這些應(yīng)用可能會受到可靠性、特異性和概括性問題的影響。

標(biāo)簽：人工智能人工智能技術(shù)