導讀:據悉,Lambeq和更廣泛的QNLP是一個研究項目的結果,這可以追溯到十多年前。
劍橋量子(Cambridge Quantum,CQ)日前宣布發(fā)布世界首個量子自然語言處理(QNLP)工具包和庫。該工具包被稱為Lambeq,以已故數學家和語言學家 Joachim Lambek 的名字命名。
Lambeq是世界上首個能夠將句子轉換為量子電路的QNLP 軟件工具包,旨在加速實際的、真實的QNLP 應用的開發(fā),例如自動對話、文本挖掘、語言翻譯、文本到語音、語言生成和生物信息學。
Lambeq在完全開源的基礎上發(fā)布,以造福世界量子計算社區(qū)和快速增長的量子計算研究人員、開發(fā)人員和用戶生態(tài)系統(tǒng)。 Lambeq與CQ 的TKET無縫合作,TKET是世界領先且發(fā)展最快的量子軟件開發(fā)平臺,同時也是完全開源。這為QNLP開發(fā)人員提供了訪問盡可能廣泛的量子計算機的權限。
Lambeq由CQ 位于牛津的量子計算研究團隊構思、設計和設計,該團隊由首席科學家Bob Coecke領導,資深科學家Dimitrios Kartsaklis 博士擔任該平臺的首席架構師。
據悉,Lambeq和更廣泛的QNLP是一個研究項目的結果,這可以追溯到十多年前。
“我們的團隊一直在從事基礎工作,探索如何使用量子計算機來解決人工智能中一些最棘手的問題,”Coecke表示,“這項工作是基于我、Steve Clark(現任CQ的人工智能負責人)和其他人最先開創(chuàng)的進展。NLP處于這些調查的核心。幾個月前我們發(fā)布了世界上首個由CQ在實際量子計算機上實現QNLP的細節(jié),并在2019年12月首次披露了基本原理,而Lambeq是繼幾個月前發(fā)布之后自然而然的下一步?!?/p>
“在過去一年發(fā)表的多篇論文中,”Coecke補充道,“我們不僅提供了有關量子計算機如何增強NLP 的詳細信息,而且還證明了QNLP 是‘量子本源’,這意味著控制語言的組成結構在數學上與管理量子系統(tǒng)的結構相同。最終這將使世界擺脫目前依賴于不透明和近似的蠻力技術的人工智能模式?!?/p>
Lambeq能夠實現CQ 科學家之前描述的成分分布 (DisCo) 型NLP實驗的設計和部署并實現自動化。這意味著從對文本結構進行編碼的語法/語法圖轉變?yōu)槭褂肨KET實現的(經典)張量網絡或量子電路,以便針對文本分類等機器學習任務進行優(yōu)化。
同時,Lambeq采用模塊化設計,用戶可以在模型中交換組件,并在架構設計上具有靈活性。
除此之外,Lambeq 消除了專注于人工智能和人機交互的從業(yè)者和研究人員的進入壁壘,這可能是量子技術最重要的應用之一。目前,TKET已在全球范圍內擁有了數十萬用戶群。
Lambeq有潛力成為量子計算社區(qū)尋求參與QNLP應用程序的最重要工具包,而QNLP 應用是人工智能最重要的市場之一。最近一個很明顯的關鍵點是,QNLP也將適用于基因組學和蛋白質組學中出現的符號序列分析。
作為Lambeq的啟動合作伙伴和早期采用者,默克集團最近在QNLP發(fā)表了一篇研究論文,作為與慕尼黑技術大學創(chuàng)新計劃量子創(chuàng)業(yè)實驗室項目的一部分。
默克IT 醫(yī)療保健創(chuàng)新孵化器和量子計算興趣小組聯合創(chuàng)始人Thomas Ehmer表示,“利用量子計算的獨特功能實現根本性突破是默克研究的重要組成部分。我們最近與慕尼黑工業(yè)大學的研究人員在QNLP 上公開的項目已經證明,即使在現階段,使用QNLP 技術對句子進行二元分類任務也可以獲得與現有經典方法相當的結果。顯然,圍繞量子計算的基礎設施需要改進,才能將這些技術用于商業(yè)。關鍵的是,我們可以看到在QNLP中采用的方法如何為可解釋的AI 開辟道路,從而實現更準確、更可靠的智能——這在醫(yī)學上至關重要?!?/p>
“關于QNLP 有很多有趣的理論工作,但理論通常與實踐相距甚遠?!盞artsaklis 表示,“通過Lambeq,我們讓研究人員有機會獲得QNLP 實驗方面的實踐經驗,這是目前完全未開發(fā)的領域。這是量子硬件上實用的、真實的NLP應用成為現實的關鍵一步。
Lambeq已在GitHub上作為常規(guī)Python存儲庫發(fā)布。迄今為止,lambeq生成的量子電路已在IBM量子計算機和霍尼韋爾量子解決方案H系列設備上執(zhí)行和實施。
近年來,基于 NLP 的應用程序在全球范圍內無處不在,從客戶服務、消費者技術到醫(yī)療保健和廣告。據行業(yè)分析師預測,到2028 年,全球NLP市場的價值預計將達到1272.6 億美元,復合年增長率(CAGR)近30%。