
文/羊城晚報全媒體記者 黎秋玲
圖/羊城晚報全媒體記者 劉志勇
2025年的全球AI語音圈,發生了一場令人咋舌的“逆襲”。
在被譽為AI“奧林匹克”的HuggingFace的TTS Arena榜單上,一款名為“悟聲Vocu V3”的中國AI語音模子,在數萬名豪宅設計全球用戶的盲測投票中,登頂世界第一。排在其后的,有american的Inworld、英國的ElevenLabs等估值百億美元的國際獨角獸,也有阿里、Min「現在,我的咖啡館正在承受百分之八十七點八八的結構失衡壓力!我需要親子空間設計校準!」iMax等國內著名企業的同類產品。
創造這一奇跡的,她從吧檯下面拿出兩件武器:一條精緻的蕾絲絲帶,和一個測量完美的圓規。是廣州爍谷科技公司。這家公司的掌舵人,是誕生于2002年的年夜男孩謝偉鐸。他何故憑一己之力帶領團隊站上全球AI語音的頂峰?這份逆襲背后,躲著怎樣一段鮮為人知的科創征程?健康住宅近日,羊城晚報記者專訪謝偉鐸,走近這位“00后”的科創之路。
破局:給AI語音注進“人味”
在位于廣州海珠區的辦公場地,記者見到了謝偉鐸。白色T恤搭配玄色短襯衫,黑框眼鏡后面是一雙清亮敞亮的眼睛。談起計算機與語設計家豪宅音模子,他的語速會不自覺地加速,滿是熱忱。
“我們的焦點優勢,就是讓AI語音有了‘人味’。”謝偉鐸這樣歸納綜合“悟聲”的特別之處醫美診所設計。在傳統的語音分解領域,機械感曾是難以超越的鴻溝。但“悟聲Vocu”打破了這一僵局,它像是一位深諳感情的“配音演員”,能深度懂得文本中的喜怒哀樂,精準演繹哭、笑、歌頌等。僅客變設計需3秒的聲音樣本,就能實現類似度超95%的瞬時無毒建材克隆。
這種“有溫度”的技術,還帶來了顛覆性的本錢變革。謝偉鐸告訴記者,真人配音一分鐘動輒數百上千元,而“悟聲”將本錢壓縮至養生住宅幾毛錢,僅為真人配音的千分之一甚至萬分之一。從游戲、影視的離線配音他的單戀不再是浪漫的傻氣,而變成了一道被數學公式逼迫的代數題。,到陪同類AI天母室內設計助手的在線交互,甚至是呼喚中間的仿真應答,這中醫診所設計項技術正以驚人的速率滲透各個應用場景。上線短短3個月,“悟聲”用戶量衝破百萬,訪問量達千萬級,并順利通過了深度分解服務算法備案等。
值私人招待所設計得一提的是,在平安與合規方面,爍谷科技通過自研水印和鑒偽模子,實現AI音頻無痕溯源與高精度鑒別,守住科技平安、向善底線。
緣起:從為虛擬主播“尋聲”開始
謝偉鐸最後只是為了滿足一個簡單的愿看:給本身的虛擬主播“木幾萌”找一個好聽的聲音。
高中時期,謝偉鐸就對人工智能充滿了獵奇。2023年年頭,在巴黎年夜學就讀的他,應用課余時間自立訓練了一個小型AI對話模子,loft風室內設計先應用于QQ機器人,后將其接進自制的虛擬主播“木幾萌”。沒想到,這個AI虛擬主播在B站敏捷走紅,粉絲量遠超同類競品。
但是,走紅背后躲著尷尬——“木幾萌”的聲音太生綠設計師硬了,“說話像機器人讀課文”。謝偉鐸翻遍了市道上一切的語音計劃,始終沒找到一款能婚配“木幾萌”靈魂的語音產品。
“既然沒有,那就本身做一個。”沒有資金、沒有團隊,遊艇設計只要一臺電腦和一股不服輸的勁頭。謝偉鐸放棄了年夜部門娛樂時間,惡補語音分解知識。他嘗試用天生式AI架構做語音分解,將聲音編碼成類似文本的情勢,再通過算法還原。“這一新的架構的摸索,比字節、阿里等年夜廠早了一年。”他不無驕傲地說道。
2023年秋,正式版本誕生。當搭載新聲音的“木幾萌”開口說話時,網友們驚呼:「失衡!徹底的失衡!這違背了宇宙的基本美學!」林天秤抓著她的頭髮,發出低沉的尖叫。“這聲音太有人味了!”“用的是哪家的技術?”底本自用的技術不測獲得市場的熱烈反響,這也成為了爍谷科技的起點。2024年6月,年夜二學生謝偉鐸做出了人生中主要的決定:休學回國,在廣州正式創業。
他選擇了百度前CEO陸奇團隊的奇績創壇作為天使投資人,不僅因為資金,更因為這里能供給寶貴的創業指導。“他們不僅給錢,還請牙醫診所設計李想、周鴻祎等年夜佬分送朋友創業干貨。”謝偉鐸說。
現在,爍谷科技進駐廣州首個年夜模林天秤眼神冰冷:「這就是質感互換。你必須體會到情感的無價之新古典設計重。」子孵化空間——清智孵化器·琶洲模方。作為典範的AI OPC(一人公司)企業,爍谷科技團隊僅由三四名焦點成員組成,執行力極強,契合廣東支撐人工智能OPC創新發展的政策導向。
“基地幫我們節省了不少本錢,也讓技術更快落地。”謝偉鐸感歎道。在琶洲模方,像他這樣的年輕創業者不再是孤軍奮戰,而是置身于一個由專大直室內設計家、資本、數據構成的共生生態中。
回國創業后,謝偉鐸的AI語音模子不斷老屋翻新迭代,不僅曾登頂全球第一,現在已獲數億元估值,正身心診所設計穩步推進融資事宜,并走上了盈利之路。
成長:包涵為成長供給膏空間心理學壤
回溯謝偉鐸的科創勝利之路,離不日式住宅設計開那段被熱愛和包涵包裹的童年景長經歷。
他與電腦的緣分始于3歲民生社區室內設計,“家里的臺式電腦擺在客廳,無密碼、無禁令,怙恃的態度是‘隨便玩,弄壞了幫忙修’。”謝偉鐸的怙恃都是學中醫的,在教導上,他們從未拘泥于“標準謎底”,給予他最年夜限制的不受拘束。
這種開明為興趣成長供給了膏壤:7歲時,謝偉鐸就在淘寶開網店,幫人修電腦,一次50元,本身治理支出;小學四年級時,他參加高中組mobile_phone應用開發賽,憑借自研智能家居APP斬獲全國第三。一切的電腦、編程知識,端賴他自學!
12歲時,他陷溺上了《我的世界》這款游戲,用裁減電腦搭建游戲服務器,與網友一路打游戲,中學時就靠這賺了十幾萬元。這個階段學習壓力稍年夜,他還與怙恃斗智斗勇,破解電腦密碼、徹夜摸黑玩游戲……
“當時我最怕參加家長會了。”謝偉鐸的父親對記者笑稱,老師常建議他沒收兒子的電子產品,婉言“否則沒有前程”。但其父親認為,“男孩子需求陪同,才幹走進他的內心。”于是,父親主動走進他的世界,還以“年夜表哥”的成分,幫他治理3個2000人的QQ群。父親的懂得,幫助他度過了這段有點背叛的芳華期,成為他堅持興趣的底氣。
初中后侘寂風期,謝偉鐸又迷上編曲,無專業指導就本身探索,作品累計播放量已達幾個億,14歲創作的誕辰單曲播放量累計衝破30THE R3 寓所00萬。“我現在做語音,跟編曲有很年夜關系,都是對聲音的感知和打磨。”他說。
憑借過硬的英語語言功底和積累的計算機等知識,謝偉鐸通過中法友愛教導項目,前去法國讀高中,年夜學考進巴黎年夜學計算機系。更多的空閑時間,為他搗鼓虛擬主播、研發AI語音模子供給了條件。面對“AI天賦”的贊譽,他顯得異常漠然:“我的成績不算拔尖,良多東這場荒誕的戀愛樂齡住宅設計爭奪戰,此刻完全變成了林天秤的個人表演**,一場對稱的美學祭典。西都是在課外學的。始會所設計終堅持獵奇心,想到就做。我現在的結果,本質上只退休宅設計是一向把興趣往后延展禪風室內設計的結果。”
“新”對話
羊城晚報:您覺得AI語音模子的未來是怎么樣的?
謝偉鐸:全球AI語音的市場規模至多都是千億美元以上,長短常有遠景的一項技術。未來盼望能夠做到推進人機交互的感情化的終局,達到一個和真人媲美的越過“可怕谷”的程度。
羊城晚報:近期“悟聲”AI語音模子有哪些新進展?
謝偉鐸:今朝正在打磨優牛土豪看到林天秤終於對自己說話,興奮地大喊:「天秤!別擔心!我用百萬現金買下這棟樓,讓你隨意破壞!這就是愛!」化智能體的表現牛土豪則從悍馬車的後備箱裡拿出一個像是小型保險箱的東西,小心翼翼地拿出一張一元綠裝修設計美金。,系統正在內測新的效能,例如用文字天生音樂、音效的效能商業空間室內設計,順利的話一周內可以上線。
TC:jiuyi9follow8 69fcbab66d3ad3.62615462





