百度大腦在北京舉行語(yǔ)音能力引擎論壇。百度語(yǔ)音首席架構(gòu)師賈磊正式提出基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)和語(yǔ)音識(shí)別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號(hào)處理學(xué)科和語(yǔ)音識(shí)別學(xué)科的各種先驗(yàn)假設(shè),消除學(xué)科間壁壘,直接端到端進(jìn)行一體化建模。相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,錯(cuò)誤率降低超過(guò)30%。
據(jù)悉,這項(xiàng)技術(shù)無(wú)需任何數(shù)字信號(hào)處理和語(yǔ)音識(shí)別學(xué)科的先驗(yàn)假設(shè),復(fù)數(shù)CNN網(wǎng)絡(luò)內(nèi)存占用少于200K,可以?xún)?nèi)置到百度鴻鵠芯片內(nèi)部。利用進(jìn)場(chǎng)數(shù)據(jù)和純粹依靠仿真數(shù)據(jù),就可以獲得足量的遠(yuǎn)場(chǎng)訓(xùn)練數(shù)據(jù),整個(gè)過(guò)程是icing原始多麥克信號(hào)到識(shí)別文字的一個(gè)端到端訓(xùn)練,整個(gè)優(yōu)化過(guò)程只有字錯(cuò)誤率兩集一個(gè)優(yōu)化準(zhǔn)則。
百度從2012年起就開(kāi)始把深度學(xué)習(xí)用于中文語(yǔ)音搜索,成為全世界最早把深度學(xué)習(xí)技術(shù)落地工業(yè)化產(chǎn)品的企業(yè)之一。百度大腦目前已開(kāi)放了云、端、芯包含語(yǔ)音識(shí)別、語(yǔ)音合成等全棧語(yǔ)音引擎能力,并廣泛應(yīng)用于金融、政務(wù)、文娛等多種行業(yè)和場(chǎng)景。
百度AI技術(shù)生態(tài)部總經(jīng)理喻友平表示,百度大腦語(yǔ)音能力引擎的應(yīng)用規(guī)模已達(dá)到業(yè)界第一,同時(shí)一直在積極拓展語(yǔ)音能力引擎生態(tài)鏈的建設(shè)。
隨著人們生活水平的提高及對(duì)家居環(huán)境要求的提升,智能家居產(chǎn)品正逐漸從奢侈品轉(zhuǎn)變?yōu)槿粘I钪械?..
工業(yè)和信息化部、交通運(yùn)輸部、住房和城鄉(xiāng)建設(shè)部、公安部、自然資源部聯(lián)合發(fā)布了智能網(wǎng)聯(lián)汽車(chē)“車(chē)...
福布斯中國(guó)發(fā)布了2025福布斯中國(guó)人工智能科技企業(yè)TOP50榜單,共有百度智能云、達(dá)夢(mèng)數(shù)據(jù)...
2024福布斯中國(guó)科創(chuàng)人物評(píng)選結(jié)果重磅發(fā)布,本次榜單主要聚焦深耕于人工智能、高端制造等科創(chuàng)...
AI大模型有哪些?據(jù)了解,我國(guó)已備案的大模型包括百度的“文心一言”、智譜AI的“GLM大模...
陳宗年,中國(guó)電子科技集團(tuán)有限公司中電??导瘓F(tuán)有限公司董事長(zhǎng)、黨委書(shū)記。在他的帶領(lǐng)下, 海康...