LioShuTan:基於 AI 技術的口說評量與語言學習平台

LioShuTan 採用 SIRAYA Model Router,透過語音轉文字(ASR)與文字轉語音(TTS)技術,為 AI 驅動的語言學習與口語評估體驗提供技術支援。.

概覽

LioShuTan 是一個專注於語言學習體驗的教育平台,內容涵蓋 AI 口說練習、聽力練習、發音評估以及互動式學習流程。.

該平台目前採用 BytePlus 的語音轉文字(ASR)與文字轉語音(TTS)服務,用於語音驗證及 AI 輔助聆聽互動。其核心工作流程旨在評估使用者能否在不同的學習情境及年齡層中,準確地發音並表達詞彙與句子。.

同時,該平台也積極評估如 Azure Pronunciation Assessment 等進階語音評估功能,以實現更細緻的語音音韻分析和詳細的發音回饋。.

隨著產品將於未來數月內全面投入量產,可擴展性、低延遲回饋以及靈活的 AI 協調機制已變得愈發重要。.

實際挑戰

在採用 AI 技術的語言學習環境中,LioShuTan 面臨了若干生產級別的挑戰:

  • 不同的語音辨識模型在發音評估準確度上呈現出顯著差異。
  • 目前的詞級別置信度評分無法精確識別具體的發音問題
  • 不同的語言、年齡層和學習情境,需要具備不同的 AI 語音功能
  • 即時語音評估工作負載需要低延遲和穩定的基礎設施
  • 該平台需要針對多家語音服務供應商進行持續的評估與測試

此外,相較於標準的 AI 語音應用場景,教育類語音應用程式對回饋品質、反應速度及使用者體驗的要求顯著更高。.

解決方案

SIRAYA 為 LioShuTan 提供了一套統一的模型路由器架構,實現了對多項語音 AI 服務的集中存取、動態路由以及靈活的模型評估。.

透過 SIRAYA 模型路由器,該平台能夠靈活調度 BytePlus ASR/TTS、Azure 發音評估以及其他語音 AI 服務,同時針對不同的學習任務和發音評估情境,動態選取最適合的模型。.

主要功能包括:

  • 跨多項 Speech AI 服務的統一存取與管理
  • 靈活測試不同 ASR 和發音評估模型
  • 基於學習情境的動態語音 AI 協調機制
  • 改善即時語音評估工作負載的穩定性
  • 簡化多供應商語音 AI 整合的複雜性

可衡量的影響

在整合 SIRAYA 模型路由器後,LioShuTan 在 AI 語言學習體驗與語音 AI 運算方面均取得了顯著提升:

  • 更穩定的 AI 語音回饋與互動式學習體驗
  • 在測試不同的語音辨識(ASR)和發音評估能力方面,擁有更大的彈性
  • 更好地适应不同年龄段和语言学习场景
  • 降低多供應商 AI 語音系統的運作複雜度
  • 更輕鬆地擴展至新的 AI 語言學習功能與工作流程

更重要的是,LioShuTan 建立了一個可擴展的 AI 語音基礎架構,專為長期運作的 AI 輔助語言學習環境而設計。.

“「SIRAYA 模型路由器讓我們能夠更靈活地評估各種語音 AI 服務及發音評估功能,並提升評估效率。」"
— 首席技術官,IT團隊,LioShuTan

分享這個案例研究:

其他客戶案例

查看SIRAYA可以為您做些什麼

您可以成為下一個故事的主角,請聯繫我們了解更多。