3月20日,聲網(wǎng)亮相2025年中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE2025),,此套件專為智能硬件開(kāi)發(fā)者量身打造,旨在助力其快速構(gòu)建 AI 實(shí)時(shí)語(yǔ)音交互產(chǎn)品,提升人機(jī)實(shí)時(shí)互動(dòng)體驗(yàn)。同時(shí),
對(duì)話式 AI 開(kāi)發(fā)套件基于博通集成(Beken)的高性能 AI 芯片 BK7258 ,實(shí)現(xiàn)強(qiáng)大的端側(cè)音頻處理,同時(shí)深度融合了聲網(wǎng)的對(duì)話式 AI 引擎,讓智能硬件設(shè)備實(shí)現(xiàn)自然流暢的實(shí)時(shí)語(yǔ)音對(duì)話、智能停頓及打斷處理、以及超低延時(shí)響應(yīng),為開(kāi)發(fā)者提供“對(duì)話式 AI + 智能硬件開(kāi)發(fā)”一站式解決方案。
目前,聲網(wǎng)已將對(duì)話式 AI 開(kāi)發(fā)套件的軟件、硬件全面開(kāi)源。硬件側(cè),將原理圖、位號(hào)圖等相關(guān)的硬件設(shè)計(jì)圖全面開(kāi)放;軟件側(cè),提供一整套面向開(kāi)發(fā)者的開(kāi)發(fā)工具箱,包括豐富的示例代碼和最佳實(shí)踐。開(kāi)發(fā)者只需下載開(kāi)源代碼,即可將對(duì)話式 AI 能力集成到自己的智能硬件設(shè)備中。1小時(shí)即可跑通 Demo,1天完成產(chǎn)品原型送樣,大幅縮短開(kāi)發(fā)周期,降低開(kāi)發(fā)門(mén)檻。
聲網(wǎng)對(duì)話式 AI 開(kāi)發(fā)套件應(yīng)用場(chǎng)景廣泛,從 AI 玩具到智能家居,可實(shí)現(xiàn)全場(chǎng)景適配,讓所有智能硬件開(kāi)口說(shuō)話。例如,AI 玩具、AI 教育硬件、AI 陪伴設(shè)備、家居語(yǔ)音助手、穿戴設(shè)備-個(gè)人助九游娛樂(lè)-官方網(wǎng)站首頁(yè)手等多種應(yīng)用場(chǎng)景。
AI 玩具、AI 機(jī)器人等智能硬件產(chǎn)品在實(shí)時(shí)互動(dòng)時(shí)會(huì)面臨諸多技術(shù)挑戰(zhàn),如背景噪音干擾語(yǔ)音識(shí)別的準(zhǔn)確性,導(dǎo)致指令接收偏差;對(duì)話延遲破壞交流的流暢性,影響用戶體驗(yàn);模型缺乏靈活性,導(dǎo)致交互模式單一,難以根據(jù)實(shí)際場(chǎng)景做出動(dòng)態(tài)調(diào)整。
針對(duì)這些問(wèn)題,聲網(wǎng)對(duì)話式 AI 開(kāi)發(fā)套件給出了有效的解決方案。其先進(jìn)的語(yǔ)音活動(dòng)檢測(cè)(VAD)技術(shù),能夠精準(zhǔn)識(shí)別語(yǔ)音信號(hào),降低背景噪音的影響,確保語(yǔ)音識(shí)別的高準(zhǔn)確率。實(shí)時(shí)語(yǔ)音合成功能實(shí)現(xiàn)了快速響應(yīng),讓交互更加流暢自然。智能打斷處理則賦予了設(shè)備靈活的對(duì)話能力,可根據(jù)用戶的表達(dá)實(shí)時(shí)調(diào)整,極大地提升了交互的適應(yīng)性與流暢度,告別“機(jī)械式”應(yīng)答,助力 AI 玩具和 AI 機(jī)器人實(shí)現(xiàn)更流暢、更迅速的交互體驗(yàn)。具體來(lái)說(shuō)聲網(wǎng)對(duì)話式 AI 開(kāi)發(fā)套件具備5大優(yōu)勢(shì):
AI 與用戶的對(duì)線ms,擁有近乎真人般的對(duì)話響應(yīng)速度與節(jié)奏,極大提升交互的流暢性。精準(zhǔn)的語(yǔ)音識(shí)別,能夠屏蔽 95% 的環(huán)境人聲及噪聲干擾,實(shí)現(xiàn)對(duì)話人聲的精準(zhǔn)識(shí)別,確保在復(fù)雜環(huán)境下也能準(zhǔn)確獲取用戶指令。
提供豐富的接口配置,例如內(nèi)置麥克風(fēng)、攝像頭以及傳感器接口,還可提供文本、音頻、視頻和觸控等多種交互功能。通過(guò) “聽(tīng)、說(shuō)、看、觸” 全維度交互形態(tài),充分滿足親情陪伴、家居控制等不同場(chǎng)景下的多樣化需求。
對(duì)話式 AI 開(kāi)發(fā)套件對(duì)大模型實(shí)現(xiàn)廣泛兼容,支持通義千問(wèn)、豆包、DeepSeek 等主流 AI 大模型服務(wù),同時(shí)也可靈活接入自研大模型,為開(kāi)發(fā)者提供豐富的選擇。
僅需 1 小時(shí)即可跑通 Demo,1 天便能完成產(chǎn)品原型送樣,極大地縮短了產(chǎn)品開(kāi)發(fā)周期,降低開(kāi)發(fā)門(mén)檻。同時(shí),軟硬件開(kāi)源的特性助力開(kāi)發(fā)者快速完成從設(shè)計(jì)到上市的全流程。
采用低功耗設(shè)計(jì)方案,支持超長(zhǎng)待機(jī),有效解決設(shè)備續(xù)航焦慮,為用戶提供更持久穩(wěn)定的使用體驗(yàn)。
聲網(wǎng)的對(duì)話式 AI 開(kāi)發(fā)套件應(yīng)用場(chǎng)景廣泛,從 AI 玩具到智能家居,可實(shí)現(xiàn)全場(chǎng)景適配,讓所有智能硬件開(kāi)口說(shuō)話。
在AI 玩具領(lǐng)域,可支持動(dòng)態(tài)調(diào)整游戲難度與劇情,保持趣味性,激發(fā)兒童創(chuàng)造力,還能即時(shí)解答兒童提問(wèn),將知識(shí)學(xué)習(xí)融入日?;?dòng)。
在AI 教育硬件方面,能夠根據(jù)學(xué)生水平調(diào)整講解深度與節(jié)奏,實(shí)現(xiàn)自適應(yīng)教學(xué)與個(gè)性化學(xué)習(xí),還能進(jìn)行語(yǔ)言能力訓(xùn)練,實(shí)時(shí)糾音糾錯(cuò),模擬真實(shí)對(duì)話環(huán)境,提升口語(yǔ)表達(dá)。
對(duì)于AI 陪伴設(shè)備,讓 AI 通過(guò)自然閑聊與情緒共鳴,成為部分人群的情感寄托,同時(shí)記錄用戶習(xí)慣,主動(dòng)提醒用藥、作息,降低健康風(fēng)險(xiǎn)。
在家居語(yǔ)音助手場(chǎng)景中,支持連續(xù)對(duì)話與模糊指令,如 “調(diào)暗燈光,放點(diǎn)音樂(lè)”,還能通過(guò)復(fù)合指令實(shí)現(xiàn)跨設(shè)備協(xié)同,像 “觀影模式” 聯(lián)動(dòng)燈光、投影儀等。
在穿戴設(shè)備-個(gè)人助手場(chǎng)景,可提供實(shí)時(shí)翻譯、實(shí)時(shí)字幕、實(shí)時(shí)會(huì)議紀(jì)要功能,并結(jié)合日程管理、任務(wù)提醒,實(shí)現(xiàn)工作流全鏈路智能化 。
2024年 AI 玩具市場(chǎng)規(guī)模已達(dá)181億美元,權(quán)威機(jī)構(gòu)預(yù)測(cè),全球 AI 玩具市場(chǎng)將迎來(lái)爆發(fā)式增長(zhǎng),預(yù)計(jì)到2033年,市場(chǎng)規(guī)模將增長(zhǎng)至600億美元。AI 玩具的快速發(fā)展為互動(dòng)娛樂(lè)創(chuàng)造了新機(jī)遇,通過(guò)實(shí)時(shí)陪伴、沉浸式故事體驗(yàn)和動(dòng)態(tài)劇情開(kāi)辟了全新的人機(jī)互動(dòng)體驗(yàn)。
專注于 AI 情感陪伴機(jī)器人的初創(chuàng)公司珞博 Robopoet,近日發(fā)布了一款口袋 AI 毛絨寵物 Fuzzoo。Fuzzoo搭載其獨(dú)創(chuàng)的 MEM(多模態(tài)情感模型),能傾聽(tīng)、感知并撫慰人心,具備養(yǎng)成屬性,提供實(shí)時(shí)個(gè)性化的陪伴。
借助聲網(wǎng)的對(duì)話式 AI 技術(shù),Fuzzoo 大幅優(yōu)化了 AI 交互的實(shí)時(shí)性和穩(wěn)定性,使得這款 AI 陪伴機(jī)器人能夠進(jìn)行自然流暢的對(duì)話,提供實(shí)時(shí)情感陪伴和個(gè)性化交互,從而為用戶帶來(lái)全新的陪伴體驗(yàn)。
Robopoet 聯(lián)合創(chuàng)始人兼 CTO 潘雨楠表示,“聲網(wǎng)的對(duì)話式 AI 技術(shù)賦予了下一代 AI 玩具和機(jī)器人實(shí)時(shí)感知、思考、反應(yīng)和交流的能力。憑借超低延遲響應(yīng)、智能打斷、以及先進(jìn)的語(yǔ)音處理能力,聲網(wǎng)讓人機(jī)互動(dòng)變的更加自然流暢,并始終為互動(dòng)體驗(yàn)的穩(wěn)定性和可靠性保駕護(hù)航。”
除此之外,目前已有數(shù)家客戶集成了聲網(wǎng)的對(duì)話式 AI 開(kāi)發(fā)套件,相關(guān)智能硬件產(chǎn)品也即將量產(chǎn)發(fā)布。例如集賢科技最近發(fā)布的“靈語(yǔ)靈珠” AI 玩具,同步使用了聲網(wǎng)的對(duì)話式 AI 開(kāi)發(fā)套件,實(shí)現(xiàn)了 AI 語(yǔ)音互動(dòng)能力,助力其打造了更智能、更靈敏、更安全的 AI 玩具。
未來(lái)聲網(wǎng)將持續(xù)完善對(duì)話式 AI 開(kāi)發(fā)套件,為更多智能硬件場(chǎng)景賦予實(shí)時(shí)互動(dòng)能力,注入數(shù)字靈魂。通過(guò)不斷地優(yōu)化實(shí)時(shí)互動(dòng)體驗(yàn),使 AI 硬件不再是機(jī)械工具,而是有情感交互的生活摯友,滿足用戶多樣化需求,適應(yīng)不同生活場(chǎng)景,推動(dòng)智能硬件行業(yè)邁向人機(jī)互動(dòng)新時(shí)代。