全尺寸人形仿生機(jī)器人,其身高達(dá)1.77米,重量為52公斤 攝影/本報(bào)記者 李娜
人工智能現(xiàn)在能有多“聰明”?
柔性物流四向車“一車跑全倉(cāng)”AR眼鏡可“同聲傳譯”
正在召開(kāi)的2023中關(guān)村論壇上,“人工智能”無(wú)疑是最熱門的關(guān)鍵詞。無(wú)論是自動(dòng)駕駛還是智能穿戴,是量子計(jì)算還是5G通信,甚至碳中和,眾多前沿科技的背后都離不開(kāi)人工智能技術(shù)的支持。可以說(shuō),未來(lái)十年,人工智能將繼續(xù)改變各行各業(yè)以及普通人的生活。在本次論壇國(guó)際技術(shù)交易大會(huì)板塊、科博會(huì)展覽板塊,以及人工智能相關(guān)平行論壇上,北京青年報(bào)記者注意到,各大公司都帶來(lái)了最新人工智能科技成果,包括視覺(jué)通用分割模型SegGPT、5G音視頻交互應(yīng)用、雙語(yǔ)數(shù)智人等等。
5G通信新應(yīng)用
可視自助服務(wù)帶來(lái)交互新體驗(yàn)
最新數(shù)據(jù)顯示,我國(guó)5G用戶已達(dá)5.61億,我國(guó)累計(jì)建成開(kāi)通5G基站 231.2萬(wàn)個(gè),全球占比均超過(guò)60%。而一季度全國(guó)平均5G下載網(wǎng)速為334.98Mbps,峰值下載速率為472.92Mbps。如此快的網(wǎng)速,再加上人工智能的支持,除了用來(lái)刷社交網(wǎng)絡(luò)、日常辦公學(xué)習(xí),還可以用來(lái)做什么?
中國(guó)聯(lián)通此次展出的“5G新通信智能交互平臺(tái)”,就應(yīng)用了5G“大帶寬、低時(shí)延、泛連接”的特點(diǎn),運(yùn)用5G音視頻交互與AI原子能力,結(jié)合AR&VR、三維建模、智能交互等先進(jìn)技術(shù),做到了5G內(nèi)生服務(wù)下的音視頻交互應(yīng)用。平臺(tái)運(yùn)用多媒體、三維建模、實(shí)時(shí)跟蹤、傳感、智能交互等技術(shù),實(shí)現(xiàn)端到端的可視化、智能化新通信服務(wù),為企業(yè)、政府等提供5G音視頻交互、智慧虛擬形象等功能。
如金融行業(yè)應(yīng)用版平臺(tái),用戶可以遠(yuǎn)程接入銀行柜臺(tái)服務(wù),享受與現(xiàn)場(chǎng)辦理同等的體驗(yàn)及個(gè)人隱私保護(hù);能源行業(yè)應(yīng)用版平臺(tái)則重構(gòu)了井場(chǎng)智能聯(lián)動(dòng)系統(tǒng)應(yīng)用體系,實(shí)現(xiàn)了井場(chǎng)資源數(shù)字化管理、井場(chǎng)巡護(hù)數(shù)字化編制。交通行業(yè)版平臺(tái)以5G新通信為基礎(chǔ)提供無(wú)障礙智能通信服務(wù),為老年乘客提供可視化交互的智慧助老服務(wù)。
值得一提的是,該平臺(tái)在國(guó)產(chǎn)化適配與自主可控方面實(shí)現(xiàn)了平臺(tái)與國(guó)產(chǎn)手機(jī)芯片適配;平臺(tái)端支持國(guó)產(chǎn)化系統(tǒng),手機(jī)側(cè)適配華為麒麟芯片、聯(lián)發(fā)科天璣芯片,支持華為、小米、OPPO、VIVO、魅族系列國(guó)產(chǎn)手機(jī)。
“數(shù)智人”更聰明
與大模型融合能“聽(tīng)懂你的話”
數(shù)智人,簡(jiǎn)單來(lái)說(shuō)就是虛擬人,借助擬人化的外表、人工智能的內(nèi)核,數(shù)智人已經(jīng)開(kāi)始在眾多行業(yè)中商業(yè)化落地,輔助人工服務(wù),提升企業(yè)運(yùn)行效率。例如,數(shù)智人在金融、文旅、傳媒、公共服務(wù)、醫(yī)療、零售等行業(yè)場(chǎng)景中,可擔(dān)任坐席客服、理財(cái)顧問(wèn)、播報(bào)主持、導(dǎo)游導(dǎo)覽角色;在文化娛樂(lè)場(chǎng)景,可以作為虛擬偶像、虛擬歌手等形成IP資產(chǎn);在智能車載、智能交通、智能家居等場(chǎng)景,可以通過(guò)與智能設(shè)備結(jié)合,為用戶提供智能化服務(wù)。
騰訊云智能小樣本數(shù)智人生產(chǎn)平臺(tái)近日首次對(duì)外發(fā)布,只需要3分鐘真人口播視頻、100句語(yǔ)音素材,平臺(tái)便可通過(guò)音頻、文本多模態(tài)數(shù)據(jù)輸入,實(shí)時(shí)建模并生成高清人像,在24小時(shí)內(nèi)制作出與真人近似的“數(shù)智人”。相較于照片生成、僅能呈現(xiàn)面部形態(tài)的數(shù)字人,小樣本數(shù)智人可根據(jù)文本設(shè)計(jì)手勢(shì),唇動(dòng)、口型、表情復(fù)現(xiàn)真人風(fēng)格。
本屆中關(guān)村論壇,北青報(bào)記者也嘗試用數(shù)智人虛擬主播,代替真人主播出鏡,進(jìn)行7×24小時(shí)的直播服務(wù),吸引了諸多觀眾關(guān)注。
不過(guò),以往的數(shù)智人,比起真人來(lái),他們的思考能力明顯更弱。此次中關(guān)村論壇上,由智譜AI推出的 “智譜AI腦數(shù)智人”則更加聰明,它不再拘泥于固定的互動(dòng)方式,而是初具理解人類指令意圖的能力。智譜AI由清華大學(xué)計(jì)算機(jī)系的技術(shù)成果轉(zhuǎn)化而來(lái),公司于2022年合作研發(fā)了雙語(yǔ)千億級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B,并主導(dǎo)構(gòu)建了高精度通用知識(shí)圖譜,把兩者有機(jī)融合為數(shù)據(jù)與知識(shí)雙輪驅(qū)動(dòng)的認(rèn)知引擎,并基于此千億基座模型打造ChatGLM。通過(guò)認(rèn)知大模型鏈接物理世界的億級(jí)用戶、賦能元宇宙數(shù)字人、成為具身機(jī)器人的基座,賦予機(jī)器像人一樣“思考”的能力。此外,它還是一個(gè)既會(huì)中文又會(huì)英文的雙語(yǔ)數(shù)智人。
“無(wú)人駕駛”上街
最新行人預(yù)測(cè)模型呼之欲出
如今在亦莊等地,已經(jīng)可以打到百度自動(dòng)駕駛的車輛。未來(lái),隨著技術(shù)發(fā)展和政策批準(zhǔn)后,車上的安全員將會(huì)撤出,自動(dòng)駕駛車輛會(huì)實(shí)現(xiàn)真正的無(wú)人化。
據(jù)百度公司介紹,無(wú)人駕駛技術(shù)核心是“百度汽車大腦Apollo平臺(tái)”,包括高精度地圖、定位、感知、智能決策與控制四大模塊。最新的Apollo已經(jīng)進(jìn)化到引入多個(gè)基于深度學(xué)習(xí)的模型、發(fā)布了基于語(yǔ)義地圖的低速行人預(yù)測(cè)模型、引入了基于語(yǔ)義地圖的模仿學(xué)習(xí)。
在本次中關(guān)村論壇上,曠視科技發(fā)布了自研智能托盤四向穿梭車系統(tǒng)。曠視智能托盤四向車作為柔性物流系統(tǒng)中的離散型設(shè)備,可以實(shí)現(xiàn)“一車跑全倉(cāng)”。為什么說(shuō)是“柔性物流”? 曠視表示,主要是因?yàn)樗哂须x散型設(shè)備、分布式控制兩大特點(diǎn),用戶企業(yè)可以像搭積木一樣,根據(jù)需要靈活組合,柔性部署。其次,柔性則體現(xiàn)在整個(gè)系統(tǒng)的“動(dòng)態(tài)可擴(kuò)展”,用戶企業(yè)可以根據(jù)淡旺季以及業(yè)務(wù)增長(zhǎng)等變化,隨時(shí)增減四向車數(shù)量,提升系統(tǒng)承載能力。
智慧城市更低碳
AI“管家”水電空調(diào)全都管
在智慧城市建設(shè)中,AI扮演著越來(lái)越重要的角色。例如,AI可以用于城市的基礎(chǔ)設(shè)施管理,例如自動(dòng)監(jiān)測(cè)道路、橋梁和建筑物的結(jié)構(gòu)健康狀況,以及檢測(cè)和修復(fù)道路上的裂縫和坑洼;AI可以幫助城市管理能源,例如通過(guò)分析能源使用數(shù)據(jù)來(lái)實(shí)現(xiàn)更高效的能源使用,以及優(yōu)化城市的能源系統(tǒng);AI也可以幫助城市保護(hù)環(huán)境,例如通過(guò)空氣質(zhì)量監(jiān)測(cè)、垃圾處理和水資源管理等方面,提高城市的環(huán)境質(zhì)量。
那么,如何利用AI給樓宇減碳來(lái)實(shí)現(xiàn)碳中和碳達(dá)峰的目標(biāo)呢?恒華數(shù)元展示的基于樓宇大腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)碳管理平臺(tái),從充分利用清潔能源的角度出發(fā),集中引用性價(jià)比較高的技術(shù)產(chǎn)品應(yīng)用,遍及樓宇末端傳感感知節(jié)點(diǎn)和主要用能設(shè)備傳感感知節(jié)點(diǎn),通過(guò)樓宇大腦邊緣計(jì)算服務(wù)器統(tǒng)一協(xié)調(diào)管理,使樓宇用能設(shè)備高效運(yùn)轉(zhuǎn),盡可能排除不必要的能源浪費(fèi),根據(jù)邊緣計(jì)算模型分析,樓宇各用能子系統(tǒng)能耗曲線處于平穩(wěn)運(yùn)行狀態(tài)下,整體能耗是最低的。
其中,樓宇電力能耗應(yīng)該占樓宇能耗的首位,針對(duì)樓宇弱電系統(tǒng)的特點(diǎn),在不增加裝修施工的基礎(chǔ)上,研發(fā)出體積更小、計(jì)量準(zhǔn)確、安裝便捷的一套弱電監(jiān)測(cè)及AI控制系統(tǒng),可以對(duì)樓宇的電力系統(tǒng)進(jìn)行動(dòng)態(tài)的監(jiān)控,確保無(wú)人區(qū)及時(shí)斷電,避免不必要的電力浪費(fèi)。而樓宇空調(diào)系統(tǒng)耗能占到樓宇總能耗的40%,恒華數(shù)元通過(guò)和高校成立產(chǎn)學(xué)研基地深度合作研發(fā)出針對(duì)樓宇冷、熱源系統(tǒng)調(diào)優(yōu)的策略算法,形成了成熟的數(shù)據(jù)算法模型,使得空調(diào)系統(tǒng)節(jié)能率達(dá)到10%以上。目前,這一項(xiàng)目已在廣東、天津、江西、四川、湖北、安徽等省份落地。未來(lái),居住小區(qū)、寫字樓、商場(chǎng)等,都將向著綠色低碳的方向“進(jìn)化”。
AR眼鏡“同聲傳譯”
智能穿戴設(shè)備助力無(wú)障礙
隨著人工智能融入生活的方方面面,搭載人工智能的設(shè)備也趨于小型化,如智能手表可接聽(tīng)電話、回微信、監(jiān)測(cè)運(yùn)動(dòng)情況等;智能眼鏡外形如普通眼鏡,戴上后可以接打電話、聽(tīng)音樂(lè)等。
不過(guò),中關(guān)村論壇上展示的這一智能眼鏡,則更實(shí)用。這款名為“亮亮聽(tīng)語(yǔ)者智能眼鏡”是一款雙目光波導(dǎo)AR智能眼鏡。
VR眼鏡戴上后會(huì)沉浸在虛擬世界,AR眼鏡則不會(huì)阻擋視線,其將現(xiàn)實(shí)世界與虛擬世界進(jìn)行融合,從而實(shí)現(xiàn)一些在現(xiàn)實(shí)世界中無(wú)法做到的功能。如聽(tīng)力受損人群常常因“聽(tīng)不清”、“聽(tīng)不見(jiàn)”聲音而在工作、社交、學(xué)習(xí)過(guò)程中遇到困難,這款眼鏡可以將聲音信息轉(zhuǎn)換成文字在眼前顯示出來(lái)。它還具有同聲傳譯功能,可以識(shí)別不同國(guó)家的語(yǔ)言,同時(shí)轉(zhuǎn)換成漢字或者其他國(guó)家的文字呈現(xiàn)前,幫助用戶在國(guó)際語(yǔ)言交流的環(huán)境中方便理解。這款眼鏡輕巧便攜,機(jī)身僅重79g,相比于目前市面上200-300g的AR眼鏡,其自重非常適合長(zhǎng)時(shí)間佩戴;還可以適配近視、遠(yuǎn)視、散光、老花眼等情況的鏡片;眼鏡外側(cè)不漏光,保護(hù)隱私,內(nèi)容僅自己可見(jiàn);這款眼鏡還搭載了毫秒級(jí)實(shí)時(shí)字幕,降噪算法,5米內(nèi)精準(zhǔn)收音,轉(zhuǎn)譯準(zhǔn)確率最高可達(dá)95%以上。據(jù)悉,該款產(chǎn)品目前已經(jīng)具備量產(chǎn)能力。
隱私保護(hù)計(jì)算技術(shù)開(kāi)源
應(yīng)用于金融醫(yī)療保險(xiǎn)等領(lǐng)域
隱私計(jì)算,也叫隱私保護(hù)計(jì)算,是指在保證數(shù)據(jù)提供方不泄露原始數(shù)據(jù)的前提下,對(duì)數(shù)據(jù)進(jìn)行分析計(jì)算的一系列信息技術(shù),實(shí)現(xiàn)數(shù)據(jù)在流通與融合過(guò)程中的“可用不可見(jiàn)”,從而實(shí)現(xiàn)數(shù)據(jù)價(jià)值的轉(zhuǎn)化和釋放。隱私保護(hù)計(jì)算對(duì)隱私數(shù)據(jù)提供了未來(lái)行業(yè)亟須的保護(hù)能力。本次中關(guān)村論壇展覽(科博會(huì))上,螞蟻集團(tuán)首次公布以關(guān)鍵基礎(chǔ)軟件為核心的開(kāi)源完整版圖,9大核心技術(shù)全部開(kāi)源,其中就包括隱私計(jì)算技術(shù)“隱語(yǔ)”。也就是說(shuō),這一技術(shù)平臺(tái)面向全球用戶開(kāi)放,可無(wú)需調(diào)用和開(kāi)發(fā)代碼,直接使用產(chǎn)品功能,幫助用戶低成本探索隱私計(jì)算應(yīng)用場(chǎng)景。
據(jù)介紹,隱語(yǔ)目前已經(jīng)在金融、醫(yī)療、保險(xiǎn)等場(chǎng)景應(yīng)用。如浦發(fā)銀行聯(lián)合螞蟻集團(tuán)隱語(yǔ)平臺(tái),識(shí)別出超過(guò)14.5萬(wàn)名高風(fēng)險(xiǎn)用戶,阻止了數(shù)十億人民幣的高風(fēng)險(xiǎn)貸款的發(fā)放。在醫(yī)療方面,螞蟻隱私計(jì)算平臺(tái)和阿里云數(shù)字醫(yī)療團(tuán)隊(duì)合作,為醫(yī)院搭建了面向醫(yī)院運(yùn)營(yíng)管理的數(shù)據(jù)融合平臺(tái),為管理者提供數(shù)字化績(jī)效管理分析,幫助醫(yī)院建立精細(xì)化運(yùn)營(yíng)管理體系,減少醫(yī)院的經(jīng)濟(jì)風(fēng)險(xiǎn)或臨床風(fēng)險(xiǎn)。此外,過(guò)往保險(xiǎn)機(jī)構(gòu)在理賠過(guò)程中,通過(guò)向醫(yī)療機(jī)構(gòu)明文(即數(shù)據(jù)不加密)查詢被保險(xiǎn)人的診療情況,將會(huì)獲得不必要的原始數(shù)據(jù)。而螞蟻的解決方案通過(guò)設(shè)定數(shù)據(jù)邏輯查詢,利用多方安全計(jì)算等隱私計(jì)算技術(shù),使得保險(xiǎn)公司只獲得是否理賠的查詢結(jié)果,不會(huì)獲得各種原始數(shù)據(jù),保護(hù)理賠用戶隱私。
聲音
大模型將改變世界 開(kāi)發(fā)的同時(shí)應(yīng)研究控制技術(shù)
ChatGPT是2023年最引人關(guān)注的科技界新事物之一,它的發(fā)布也引發(fā)了語(yǔ)言大模型狂潮,百度、阿里、知乎、商湯、京東等多個(gè)公司紛紛推出了其大模型。AI另一個(gè)重大領(lǐng)域——視覺(jué)GPT也亮相本屆中關(guān)村論壇:智源研究院視覺(jué)團(tuán)隊(duì)正式推出通用分割模型 SegGPT,這是首個(gè)利用視覺(jué)提示完成任意分割任務(wù)的通用視覺(jué)模型。
據(jù)介紹,SegGPT使用時(shí),擯棄語(yǔ)言類大模型的傳統(tǒng)思維,與機(jī)器交互時(shí)不使用文字而是使用圖像。比如用戶給出SegGPT一張圖并在上面將“彩虹”圈了起來(lái),當(dāng)用戶再給許多張包含有彩虹的圖片時(shí),SegGPT就能自動(dòng)識(shí)別上面的彩虹,并將這些部分圈出來(lái)?梢哉f(shuō),SegGPT “一通百通”:給出一個(gè)或幾個(gè)示例圖像和意圖掩碼,模型就能get用戶意圖,“有樣學(xué)樣”地完成類似分割任務(wù)。此外,SegGPT還“一觸即通”:通過(guò)一個(gè)點(diǎn)或邊界框,在待預(yù)測(cè)圖片上給出交互提示,識(shí)別分割畫面上的指定物體。利用這個(gè)特性,可以實(shí)現(xiàn)諸多功能,比如機(jī)器人機(jī)械手去拿西紅柿等物件時(shí),機(jī)器人就可以迅速知道西紅柿的邊緣在哪里,既能拿起西紅柿,又不會(huì)捏碎,十分精準(zhǔn)。
目前,國(guó)內(nèi)大模型處在百花齊放、百家爭(zhēng)鳴的狀態(tài)下。百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏在中關(guān)村論壇上表示,人工智能再次成為人類創(chuàng)新的焦點(diǎn),越來(lái)越多的人認(rèn)可第四次產(chǎn)業(yè)革命正在到來(lái)。他強(qiáng)調(diào):“大模型改變了人工智能,大模型即將改變世界。”中國(guó)工程院院士、中國(guó)人工智能學(xué)會(huì)理事長(zhǎng)戴瓊海也表示,人工智能將帶來(lái)多個(gè)方面的應(yīng)用變革:面向科學(xué)研究新范式(宇宙起源、自然規(guī)律、生命奧秘);面向人民生命健康(AI藥物研發(fā)、遠(yuǎn)程虛擬手術(shù));面向經(jīng)濟(jì)主戰(zhàn)場(chǎng)(虛擬創(chuàng)造、工業(yè)制造、靈境交互);面向國(guó)防重大需求(多源態(tài)勢(shì)分析、AI地空戰(zhàn)線部署)等等。
值得關(guān)注的是,面對(duì)新變化,也有人提出了警示。創(chuàng)新工場(chǎng)董事長(zhǎng)、首席執(zhí)行官李開(kāi)復(fù)表示,“AI仍會(huì)出錯(cuò),會(huì)一本正經(jīng)地胡說(shuō)八道,它只能被應(yīng)用于生成內(nèi)容初稿、開(kāi)拓想法,而不能作為最終版本,AI需要持續(xù)的人工干預(yù),避免謬誤或?yàn)?zāi)難發(fā)生。此外,AI可能還存在一些法律及倫理問(wèn)題,因此,AI并非適合所有的領(lǐng)域,只能應(yīng)用于容錯(cuò)度較高的應(yīng)用中。”李開(kāi)復(fù)強(qiáng)調(diào),“AI可能制造虛假信息,可能被不法分子利用來(lái)做針對(duì)性的欺騙用戶,因此,開(kāi)發(fā)時(shí),需要同時(shí)研究控制AI的技術(shù)和管理的法律法規(guī)!
本版文/本報(bào)記者 溫婧
統(tǒng)籌/余美英
(北京青年報(bào))