頂[0] 分享評(píng)論[0] 編輯

商量SenseChat

商量SenseChat是商湯科技開(kāi)發(fā)的千億參數(shù)大語(yǔ)言模型應(yīng)用平臺(tái)。該產(chǎn)品具備語(yǔ)義理解、多輪對(duì)話、知識(shí)掌握、邏輯推理等綜合能力，可為醫(yī)療、金融、移動(dòng)終端、代碼開(kāi)發(fā)、企業(yè)服務(wù)、城市管理、汽車出行、教育等垂直領(lǐng)域用戶提供服務(wù)。

2023年4月10日，商湯發(fā)布了大型模型系統(tǒng)SenseNova和該系統(tǒng)下的大型語(yǔ)言模型討論商量。2023年8月31日，商量正式向用戶開(kāi)放，作為第一批開(kāi)發(fā)大規(guī)模模型的科技公司，商湯通過(guò)咨詢商量實(shí)現(xiàn)了生成式人工智能相關(guān)收入的增長(zhǎng)。截至2023年10月，商量主要服務(wù)于B端，與金融、手機(jī)、醫(yī)療、汽車、房地產(chǎn)、能源、媒體、工業(yè)制造等多個(gè)垂直行業(yè)的500多家客戶建立了深度合作。

發(fā)展歷史編輯本段

投資機(jī)遇

2014年，商湯科技成立。作為一家人工智能軟件公司，商湯科技以“堅(jiān)持原創(chuàng)，讓AI引領(lǐng)人類進(jìn)步”為使命，長(zhǎng)期投入AI研究。2015年，商湯開(kāi)始開(kāi)發(fā)深度學(xué)習(xí)訓(xùn)練框架SenseParrots，這是商湯智能計(jì)算基礎(chǔ)設(shè)施SenseCore的核心。2018年前后，商湯開(kāi)始著手準(zhǔn)備大模型初始階段所需的算力、算法和數(shù)據(jù)。2018年4月，商湯啟動(dòng)人工智能計(jì)算原型開(kāi)發(fā)項(xiàng)目。同年10月，OpenMMLab人工智能算法開(kāi)源系統(tǒng)上線，涉及10多個(gè)研究方向，開(kāi)放了130多個(gè)算法和1000個(gè)預(yù)訓(xùn)練模型。2021年7月，商湯開(kāi)始打造SenseCore AI。2022年1月，商湯的上海臨港人工智能智能計(jì)算中心（AIDC）正式投入運(yùn)營(yíng)。AIDC是尚湯艾設(shè)備的重要計(jì)算基地，其設(shè)計(jì)峰值計(jì)算能力高達(dá)每秒374億次浮點(diǎn)運(yùn)算，使其成為亞洲最大的超級(jí)計(jì)算中心之一。

2022年11月30日，OpenAI推出了ChatGPT聊天機(jī)器人。ChatGPT被視為通向通用人工智能的道路（AGI）。此后，大語(yǔ)言模型迅速引起了世界各國(guó)的廣泛關(guān)注。商湯科技開(kāi)展了新的業(yè)務(wù)探索，并于2023年2月25日推出了SenseCore尚湯艾云，基于該云構(gòu)建了AGI基礎(chǔ)設(shè)施并開(kāi)發(fā)了大型模型系統(tǒng)。

發(fā)布開(kāi)發(fā)

2023年4月10日，商湯發(fā)布了大規(guī)模模型系統(tǒng)“SenseNova”，該系統(tǒng)包括自然語(yǔ)言處理、內(nèi)容生成、自動(dòng)數(shù)據(jù)標(biāo)注、用戶自定義模型訓(xùn)練等眾多大規(guī)模模型和能力，其中包括大規(guī)模語(yǔ)言模型“咨詢商量”。討論的意思是“如果你討論，你就可以解決它?！盨enseChat1.0基于海量數(shù)據(jù)和深度計(jì)算能力開(kāi)發(fā)，具備多輪對(duì)話和超長(zhǎng)文本理解能力，支持編程助手、健康咨詢助手、PDF文件閱讀助手等應(yīng)用。

商量SenseChat

2023年6月，商湯發(fā)布了第一款基礎(chǔ)型號(hào)InternLM，其綜合能力超過(guò)了GPT-3.5-turbo。該模型的參數(shù)達(dá)到1040億個(gè)，并使用1.6萬(wàn)億token多語(yǔ)言語(yǔ)料庫(kù)進(jìn)行訓(xùn)練，支持20多種語(yǔ)言。在此基礎(chǔ)上，討論SenseChat2.0將于7月初發(fā)布。討論了商量2.0在MMLU、AGIEval和C-Eval的評(píng)估中領(lǐng)先于ChatGPT，其中一些非常接近GPT-4的水平。2023年8月，新型號(hào)InternLM-123B完成了訓(xùn)練，其測(cè)試成績(jī)?cè)谌?1個(gè)知名評(píng)估集中的30萬(wàn)個(gè)問(wèn)題中排名世界第二，超過(guò)了GPT-3.5-turbo和LLaMA2-70B。在此基礎(chǔ)上，討論將商量升級(jí)到3.0版。2023年8月31日，商量正式向用戶開(kāi)放。討論商量3.0在2023年9月SuperCLUE中國(guó)大型車型總榜單中排名第一。商量3.0在人工智能代理（由SuperCLUE添加的人工智能子列表）中排名第一，領(lǐng)先于所有中國(guó)中國(guó)大型模型、GPT 3.5和克勞德2。

2023年上半年，借助大設(shè)備的計(jì)算能力、“逐日增長(zhǎng)”大模型系統(tǒng)的大語(yǔ)言模型和文生圖模型的研發(fā)，商湯與生成式人工智能相關(guān)的收入增長(zhǎng)670.4%，收入貢獻(xiàn)占比超過(guò)20%。截至2023年10月，商量已與金融、手機(jī)、醫(yī)療、汽車、房地產(chǎn)、能源、媒體和工業(yè)制造等多個(gè)垂直行業(yè)的500多家客戶建立了深度合作。

版本信息

2023年4月10日

1.0：它包含1800億個(gè)參數(shù)，支持長(zhǎng)文本知識(shí)理解、交互式多輪對(duì)話、自動(dòng)及時(shí)的知識(shí)更新，并具有通過(guò)模型理解問(wèn)題后生成和總結(jié)答案的能力；支持的應(yīng)用包括:編程助手，可以幫助開(kāi)發(fā)人員更高效地編寫和調(diào)試代碼；健康咨詢助手，為用戶提供個(gè)性化醫(yī)療建議；PDF文件閱讀助手，可以輕松地從復(fù)雜的文檔中提取和總結(jié)信息

2023年7月7日

2.0：它突破了大語(yǔ)言模型輸入長(zhǎng)度的限制，支持阿拉伯語(yǔ)和粵語(yǔ)，并推出不同參數(shù)順序的模型版本，可適應(yīng)移動(dòng)終端、云等不同終端和場(chǎng)景的應(yīng)用需求，降低部署成本；知識(shí)和信息的準(zhǔn)確性、邏輯判斷能力、語(yǔ)境理解能力和創(chuàng)造力都有了很大的提高。

2023年8月31日

3.0：基礎(chǔ)模型為“學(xué)者普宇I(lǐng)nternLM-123B”，擁有1230億個(gè)參數(shù)，生成的內(nèi)容更加準(zhǔn)確可靠，可用于復(fù)雜場(chǎng)景下的多步推理和計(jì)算。具有獨(dú)立反思和糾錯(cuò)的能力；代碼解釋器和插件調(diào)用能力已經(jīng)升級(jí)。python解釋器、API調(diào)用和搜索可用于解決復(fù)雜任務(wù)和構(gòu)建AI代理應(yīng)用程序。

支持技術(shù) 編輯本段

計(jì)算能力和數(shù)據(jù)：商湯的SenseCore基于商湯人工智能計(jì)算中心的AIDC，擁有3萬(wàn)個(gè)在線GPU，可輸出6000 Petaflops，可有效支持大型語(yǔ)言模型的訓(xùn)練、升級(jí)迭代和服務(wù)。到2023年8月，尚湯燦每月產(chǎn)生約2萬(wàn)億個(gè)高質(zhì)量數(shù)據(jù)令牌，以支持基礎(chǔ)模型訓(xùn)練。此外，該公司還投入了數(shù)百臺(tái)配備千卡GPU計(jì)算資源的服務(wù)器，并使用算法結(jié)合人工方法對(duì)原始語(yǔ)料數(shù)據(jù)進(jìn)行分類和精細(xì)清洗，以確保數(shù)據(jù)的質(zhì)量、安全性和價(jià)值符合要求。

基礎(chǔ)模型：學(xué)者Puyu InternLM是由上海人工智能實(shí)驗(yàn)室（上海ai實(shí)驗(yàn)室）、商湯科技、香港中文大學(xué)、復(fù)旦大學(xué)和上海交通大學(xué)發(fā)布的多語(yǔ)言、數(shù)十億參數(shù)的基座模型，并在萬(wàn)億代幣數(shù)據(jù)上進(jìn)行訓(xùn)練。

數(shù)據(jù)集：InternetLM的訓(xùn)練數(shù)據(jù)集來(lái)源包括網(wǎng)頁(yè)、書籍、學(xué)術(shù)論文、代碼等。語(yǔ)料庫(kù)包含多種語(yǔ)言的文檔，其中英文文本涵蓋了廣泛的領(lǐng)域，而中文文本則增強(qiáng)了模型對(duì)中國(guó)和中國(guó)文化的了解。雖然其他語(yǔ)言的文本只占很小的比例，但也提高了模型的多語(yǔ)言能力。為了保證語(yǔ)言模型預(yù)處理的魯棒性和準(zhǔn)確性，進(jìn)行了一些數(shù)據(jù)處理，分為四個(gè)階段:語(yǔ)言分類，將所有文檔按照主要語(yǔ)言（如英語(yǔ)、漢語(yǔ)或其他語(yǔ)言）進(jìn)行分類，實(shí)現(xiàn)語(yǔ)言感知的數(shù)據(jù)處理；基于規(guī)則過(guò)濾，通過(guò)各種規(guī)則和啟發(fā)式方法去除無(wú)關(guān)或低質(zhì)量的內(nèi)容；基于模型過(guò)濾，在黃金標(biāo)準(zhǔn)語(yǔ)料庫(kù)上訓(xùn)練的小語(yǔ)言模型用于識(shí)別那些高質(zhì)量的文檔，以確保所有訓(xùn)練數(shù)據(jù)都符合高質(zhì)量標(biāo)準(zhǔn)。重復(fù)數(shù)據(jù)刪除意味著消除相似的文檔或完全重復(fù)的段落，以減少數(shù)據(jù)冗余并避免破壞模型性能。

模型設(shè)計(jì)：interlm-104 b的模型架構(gòu)采用基于變壓器的解碼器架構(gòu)，類似于GPT系列。該模型包括82個(gè)變壓器層，每層有80個(gè)頭，頭維度設(shè)置為128。因此，模型大小為10240。

培訓(xùn)過(guò)程：訓(xùn)練過(guò)程分為幾個(gè)階段，每個(gè)階段通過(guò)控制不同比例的數(shù)據(jù)來(lái)定義其優(yōu)化目標(biāo)。并選擇適當(dāng)?shù)臄?shù)據(jù)集來(lái)評(píng)估進(jìn)度。如果某個(gè)特定階段未能達(dá)到預(yù)期，我們將從該階段結(jié)束時(shí)重新開(kāi)始訓(xùn)練，以避免重新開(kāi)始，從而提高訓(xùn)練效率。為了確保數(shù)據(jù)利用率，不會(huì)對(duì)相同的數(shù)據(jù)進(jìn)行重新采樣。此外，為了進(jìn)一步提高訓(xùn)練效率，不同長(zhǎng)度的句子將被打包成固定長(zhǎng)度的序列，并使用特殊符號(hào)來(lái)描述不同的句子。訓(xùn)練過(guò)程中使用的優(yōu)化參數(shù)包括:學(xué)習(xí)速率、批量大小和總學(xué)習(xí)步驟。通過(guò)余弦學(xué)習(xí)速率調(diào)度將最大學(xué)習(xí)速率設(shè)置在2e-4和4e-5之間。在每個(gè)訓(xùn)練階段結(jié)束時(shí)，最終學(xué)習(xí)率下降到峰值學(xué)習(xí)率的10%。訓(xùn)練中使用的優(yōu)化算法是AdamW，其特征是β1值為0.9，β2值為0.95。權(quán)重衰減的范圍保持在0.01-0.1之間，所有階段的梯度削波值和學(xué)習(xí)率預(yù)熱比分別保持在1.0和0.025。

監(jiān)督微調(diào)：SFT（監(jiān)督微調(diào)）:收集了一個(gè)包含問(wèn)答對(duì)和多輪對(duì)話的教學(xué)數(shù)據(jù)集?；谥噶顢?shù)據(jù)集，以監(jiān)督的方式對(duì)模型進(jìn)行微調(diào)。獎(jiǎng)勵(lì)模型的訓(xùn)練:根據(jù)3H標(biāo)準(zhǔn)，即幫助、無(wú)害和誠(chéng)實(shí)，訓(xùn)練了一個(gè)獎(jiǎng)勵(lì)模型。我們?cè)诨ヂ?lián)網(wǎng)上收集用戶提示，構(gòu)建一組有毒提示，然后使用人類注釋器、語(yǔ)言模型和注釋偏好來(lái)生成不同的響應(yīng)。獎(jiǎng)勵(lì)模型從SFT模型初始化，最后一個(gè)投影層由新的全連接層替換。人工反饋強(qiáng)化學(xué)習(xí)（RLHF）:基于獎(jiǎng)勵(lì)模型，使用近似策略優(yōu)化（PPO）進(jìn)一步微調(diào)SFT模型。此階段的目的是使模型響應(yīng)與人類偏好一致。

產(chǎn)品功能編輯本段

基本功能

咨詢商量具有語(yǔ)義理解、多輪對(duì)話、知識(shí)掌握和邏輯推理的綜合能力。它使用大量數(shù)據(jù)進(jìn)行訓(xùn)練并充分考慮中文上下文，因此可以理解和處理中文文本，并具有理解多輪對(duì)話和長(zhǎng)文本的能力；憑借合理性判斷和邏輯推理能力，我們可以判斷用戶給出的陳述是否合理，也可以根據(jù)前提和事實(shí)進(jìn)行推導(dǎo)，以處理復(fù)雜的邏輯問(wèn)題。它還可以通過(guò)與用戶的多輪互動(dòng)解決復(fù)雜問(wèn)題，提供定制化建議，協(xié)助文本創(chuàng)作，并自帶知識(shí)自動(dòng)及時(shí)更新模塊，從而生成更可信、準(zhǔn)確、更安全的信息；并且具有一定的共情能力，可以成為用戶傾訴社交壓力、情感困惑等個(gè)人問(wèn)題的對(duì)象。此外，咨詢還可以通過(guò)字符識(shí)別技術(shù)閱讀和理解PDF文件，并根據(jù)用戶關(guān)于文件輸入的問(wèn)題給出相應(yīng)的答案。

擴(kuò)展功能

AI代碼助手：AI代碼助手是基于大型語(yǔ)言模型的人工智能輔助開(kāi)發(fā)工具，應(yīng)用于編程領(lǐng)域。AI代碼助手支持中英文和多種編程語(yǔ)言，并能適應(yīng)開(kāi)發(fā)人員的個(gè)性化編碼風(fēng)格，提高開(kāi)發(fā)效率并減少開(kāi)發(fā)錯(cuò)誤。它具有代碼補(bǔ)全、代碼擴(kuò)展、代碼翻譯、代碼重構(gòu)、代碼修正、注釋代碼生成、復(fù)雜性分析和測(cè)試用例生成等功能。

大醫(yī)：基于問(wèn)診模式的醫(yī)療健康大語(yǔ)言模型?；谌f(wàn)億代幣的預(yù)訓(xùn)練語(yǔ)料庫(kù)，以超200億代幣的高質(zhì)量醫(yī)學(xué)知識(shí)數(shù)據(jù)進(jìn)行訓(xùn)練，涵蓋醫(yī)學(xué)教科書、醫(yī)學(xué)指南、臨床路徑、藥物庫(kù)、疾病庫(kù)、體檢報(bào)告，以及4000萬(wàn)真實(shí)病歷、醫(yī)患問(wèn)答等。大醫(yī)生的嵌入式醫(yī)療“場(chǎng)景集市”包括智慧健康、智慧患者服務(wù)、智慧門診和數(shù)字智能建設(shè)四大領(lǐng)域，包含智能自診、用藥咨詢、診后隨訪管理、智慧病歷和結(jié)構(gòu)化視頻報(bào)告等13個(gè)預(yù)設(shè)場(chǎng)景。支持提示項(xiàng)目定制、長(zhǎng)期記憶訪問(wèn)、醫(yī)學(xué)知識(shí)庫(kù)查詢匯總等個(gè)性化功能。

獲得榮譽(yù) 編輯本段

2023年11月18日，新華社中國(guó)企業(yè)發(fā)展研究中心發(fā)布《人工智能大模型體驗(yàn)報(bào)告3.0》，對(duì)國(guó)內(nèi)主流大模型進(jìn)行了全面評(píng)估。根據(jù)該報(bào)告，在量化衡量情商的維度上，商湯的商量在10個(gè)被評(píng)估的大型模型中排名第一。分析表明，就智商指數(shù)而言，商量能夠根據(jù)指令回答問(wèn)題；在情商指標(biāo)方面，它可以給出詳細(xì)的計(jì)劃，多種角度切入問(wèn)題，并能引發(fā)用戶深入思考。商量憑借其技術(shù)實(shí)力和發(fā)展?jié)摿Ρ恍氯A研究院評(píng)為中國(guó)大型模型市場(chǎng)的“未來(lái)領(lǐng)導(dǎo)者”。

詞條內(nèi)容僅供參考，如果您需要解決具體問(wèn)題
（尤其在法律、醫(yī)學(xué)等領(lǐng)域），建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。

如果您認(rèn)為本詞條還有待完善，請(qǐng) 編輯

上一篇手機(jī)銀行下一篇基本輸入輸出系統(tǒng)

国产内射大片99,欧美丰满熟妇xxxx,bt天堂在线www中文,男人扒开女人的腿做爽爽视频,亚洲av影院一区二区三区

商量SenseChat

發(fā)展歷史編輯本段

投資機(jī)遇

發(fā)布開(kāi)發(fā)

版本信息

支持技術(shù) 編輯本段

產(chǎn)品功能編輯本段

基本功能

擴(kuò)展功能

獲得榮譽(yù) 編輯本段

附件列表

標(biāo)簽

同義詞

国产内射大片99,欧美丰满熟妇xxxx,bt天堂在线www中文,男人扒开女人的腿做爽爽视频,亚洲av影院一区二区三区

商量SenseChat

發(fā)展歷史 編輯本段

投資機(jī)遇

發(fā)布開(kāi)發(fā)

版本信息

支持技術(shù) 編輯本段

產(chǎn)品功能 編輯本段

基本功能

擴(kuò)展功能

獲得榮譽(yù) 編輯本段

附件列表

標(biāo)簽

同義詞

發(fā)展歷史編輯本段

產(chǎn)品功能編輯本段