數(shù)字大屏和AI數(shù)字人結(jié)合軟件系統(tǒng)定制開發(fā)
大家好,我是成都小火科技的項目經(jīng)理,今天是2025年11月12日,星期三。上個月我?guī)е鴪F隊幫某政務單位做數(shù)據(jù)匯報系統(tǒng)升級的時候,存在客戶突然提出一個新想法的情況,他們說現(xiàn)在的數(shù)字大屏雖然數(shù)據(jù)展示得挺全,但總覺得少了點“人氣”,想讓屏幕上的數(shù)據(jù)“活”起來,找個AI數(shù)字人當專屬講解員?,F(xiàn)在AI數(shù)字人應用得越來越廣泛,和數(shù)字大屏結(jié)合起來,確實是個頗為新穎又實用的方向,也讓我立刻想到了我們之前開發(fā)數(shù)據(jù)大屏監(jiān)測系統(tǒng)和AI智慧教育系統(tǒng)時積累的那些技術經(jīng)驗,于是我當場就跟客戶表示這個項目我們能接,接下來這大半個月的開發(fā)過程,真的有太多細節(jié)值得好好說說。
客戶第一次來我們公司詳談的時候,一進門就頗為急切地問了我好幾個核心問題,第一個是我們公司到底有多少技術人員,能不能確保這個項目的開發(fā)質(zhì)量;第二個是能不能提供一份詳細的開發(fā)進度表,他們好隨時跟進項目情況;第三個則是上線后如果出現(xiàn)bug,我們到底負不負責維修,維護費又該怎么收。這些問題其實都是很多客戶在合作前常常會問到的狀況,我早就習慣了用最實在的方式去回應。我當時就打開我們公司的官網(wǎng),指著上面的資質(zhì)信息跟他們介紹,我所在的成都小火科技是2013年成立的,現(xiàn)在研發(fā)人員的占比超過80%,其中30%以上都來自阿里、字節(jié)這些互聯(lián)網(wǎng)大廠,光AI算法工程師就有足足12個,技術實力絕對有保障。至于開發(fā)進度表,我當場就讓產(chǎn)品經(jīng)理根據(jù)初步需求,整理了一份包含需求拆解、模型訓練、大屏適配、聯(lián)調(diào)測試四個階段的進度表,每個階段的開始時間、結(jié)束時間和驗收標準都寫得明明白白,還承諾每個階段結(jié)束后都會主動跟他們對接驗收。關于bug修復和維護費的問題,我也說得很清楚,上線后6個月內(nèi)出現(xiàn)的bug我們都免費負責修復,維護費是按年收取的,費用大概是項目總額的15%,這樣的答復讓客戶的顧慮總算是打消了不少。
正式進入開發(fā)階段后,我們團隊做的第一件事就是把平臺的核心功能拆解開,存在我們將整個平臺分成AI數(shù)字人、數(shù)字大屏、數(shù)據(jù)聯(lián)動三個核心模塊的情況,每個模塊都安排了專門的技術小組負責,這樣分工明確,效率也能高不少。AI數(shù)字人這個模塊是整個項目的重點,我們采用了超寫實的數(shù)字人建模技術,先找了專業(yè)的講解員來采集肢體語言和語音樣本,再通過動作捕捉設備把這些數(shù)據(jù)導入系統(tǒng),配合NLP自然語言處理算法,讓數(shù)字人不僅能說話,還能準確理解用戶的問題并給出回應,這個技術邏輯其實和我們之前開發(fā)AI智慧教育系統(tǒng)時用到的人機交互邏輯頗為相似。數(shù)字大屏模塊則是延續(xù)了我們開發(fā)數(shù)據(jù)大屏監(jiān)測系統(tǒng)的成熟經(jīng)驗,支持多數(shù)據(jù)源接入,不管是政務系統(tǒng)里的統(tǒng)計數(shù)據(jù),還是物聯(lián)網(wǎng)設備實時上傳的數(shù)據(jù),都能順利導入,而且數(shù)據(jù)更新的延遲能控制在1秒以內(nèi),確保展示的數(shù)據(jù)都是最新的。最關鍵的還是數(shù)據(jù)聯(lián)動模塊,我們用java開發(fā)了專門的數(shù)據(jù)解析接口,讓AI數(shù)字人能實時抓取數(shù)字大屏上的數(shù)據(jù),并且根據(jù)數(shù)據(jù)變化自動生成解讀文案,比如當大屏上的GDP數(shù)據(jù)超過預設閾值時,數(shù)字人就會自動重點講解增長的原因和具體的構(gòu)成,這樣一來,數(shù)據(jù)和講解就真正實現(xiàn)了無縫銜接。
開發(fā)過程中,存在我們遇到不少技術難題的狀況,其中最讓人頭疼的就是數(shù)字人動作與語音不同步的問題。在初期的測試階段,數(shù)字人的口型和語音總是存在0.3秒左右的延遲,看起來特別僵硬,一點都不自然,我當時心里也頗為著急,趕緊組織技術團隊開了個緊急會議。會上有個技術骨干提出,可以采用預加載機制,把一些常用的解讀話術對應的口型動作提前緩存到系統(tǒng)里,同時優(yōu)化語音合成算法,提升語音生成的速度。存在我們按照這個思路反復調(diào)試了好幾天的情況,每天都要進行上百次的測試和調(diào)整,最終總算是把延遲控制在了0.1秒以內(nèi),從視覺上完全看不出破綻,這個結(jié)果讓整個團隊都松了一口氣。還有個小插曲,項目進行到第8周的時候,客戶突然提出想讓數(shù)字人支持多語種講解,說有時候會有外國訪客來參觀,需要英文和日文的講解服務。我當時雖然擔心會影響項目進度,但想到這確實是個實用的需求,還是立刻安排技術團隊著手開發(fā),沒想到他們僅用5天就完成了多語言語音包的接入和調(diào)試,讓數(shù)字人順利實現(xiàn)了中文、英文、日文的實時切換,客戶得知后也頗為驚喜,一個勁地夸我們團隊反應快。
我一直覺得,一個項目能順利推進,除了技術實力,規(guī)范的開發(fā)流程也頗為重要。我們公司有著嚴格的軟件開發(fā)流程,從軟件銷售對接需求開始,到產(chǎn)品經(jīng)理梳理需求文檔,再到技術主管制定技術方案,UI設計、前端開發(fā)、后端開發(fā)、前后端聯(lián)調(diào)、測試服部署、測試人員驗收、正式上線,最后到后期運維,每個環(huán)節(jié)都有專人負責,專人專崗,確保每一步都不會出問題。這次項目我們選用了自主服務器,因為客戶是政務單位,數(shù)據(jù)的敏感性比較高,自主服務器能更好地保障數(shù)據(jù)安全,我們還特意配備了異地備份系統(tǒng),防止出現(xiàn)數(shù)據(jù)丟失的狀況。另外,考慮到客戶團隊可能對平臺的操作不太熟悉,在項目接近尾聲的時候,我特意安排了專門的培訓,親自帶著他們熟悉后臺的操作,從數(shù)字人的語音調(diào)整、大屏數(shù)據(jù)的導入,到常見問題的排查,每一個步驟都講得明明白白,還制作了圖文并茂的操作手冊,方便他們后續(xù)查閱。
現(xiàn)在這個平臺已經(jīng)順利驗收交付了,前幾天客戶還特意給我發(fā)消息,說在一次政務公開活動中,AI數(shù)字人全程獨立完成了20分鐘的講解,現(xiàn)場的反響特別熱烈,不少訪客都夸這個形式新穎又實用?;剡^頭來復盤整個項目,我總結(jié)出了兩個頗為重要的經(jīng)驗,第一個是AI數(shù)字人的模型訓練一定要用足夠多的真實數(shù)據(jù),前期我們光是采集講解員的動作和語音樣本就花了整整一周,這些扎實的基礎工作才讓后續(xù)的開發(fā)少走了很多彎路;第二個是數(shù)字大屏的適配要考慮到不同的屏幕尺寸,我們這次特意做了適配優(yōu)化,從55寸的小屏幕到210寸的超大屏幕都能正常使用,大大提升了平臺的通用性。我所在的成都小火科技作為高新技術企業(yè),還擁有ISO/IEC 27001:2002認證和ISO900認證,這些資質(zhì)也讓我們在開發(fā)這類涉及敏感數(shù)據(jù)的項目時更有底氣。未來,我們計劃把這個平臺的技術應用到更多場景,比如企業(yè)展廳、博物館這些地方,讓AI數(shù)字人和數(shù)字大屏的結(jié)合,成為信息傳播的新載體。在現(xiàn)在這個數(shù)據(jù)時代,讓冰冷的數(shù)據(jù)通過更生動的方式“說話”,才能真正發(fā)揮出數(shù)據(jù)所蘊含的價值,這也是我作為一名軟件項目經(jīng)理,一直以來所追求的目標。
文章來源網(wǎng)址:http://www.suimin.com.cn/archives/xitongkaifa01/2400,轉(zhuǎn)載請注明出處!
精選案例
推薦文章
Core competence
高質(zhì)量軟件開發(fā)公司-成都小火科技
多一套方案,多一份選擇
聯(lián)系小火科技項目經(jīng)理,及時獲取專屬《項目方案》及開發(fā)報價
咨詢相關問題或預約面談,可以通過以下方式與我們聯(lián)系
業(yè)務熱線 19113551853
19113551853