6月20日至22日,2025年IEEE第三屆模式識(shí)別、機(jī)器視覺(jué)與人工智能國(guó)際學(xué)術(shù)會(huì)議(IEEE PRMVAI 2025)在湖南人文科技學(xué)院隆重召開。本屆會(huì)議由IEEE中國(guó)聯(lián)合會(huì)、湖南人文科技學(xué)院主辦,并獲得了南京航空航天大學(xué)、山東女子學(xué)院、愛(ài)邇思出版社、ESBK國(guó)際學(xué)術(shù)交流中心、AC學(xué)術(shù)平臺(tái)等高校與學(xué)術(shù)單位的共同支持,吸引了來(lái)自國(guó)內(nèi)外數(shù)十余所高校和科研院所的知名專家學(xué)者100余人參加此次盛會(huì)。

大會(huì)合照
本次會(huì)議主題涵蓋了模式識(shí)別、機(jī)器視覺(jué)與人工智能相關(guān)的多學(xué)科,共吸引了百余專家學(xué)者參與,共設(shè)立1場(chǎng)主旨報(bào)告、4場(chǎng)特邀報(bào)告以及分會(huì)場(chǎng)的口頭報(bào)告。會(huì)議伊始,湖南人文科技學(xué)院黨委副書記朱強(qiáng)教授出席并致開幕辭。

湖南人文科技學(xué)院黨委副書記朱強(qiáng)教授作開幕致辭
享受國(guó)務(wù)院“政府特殊津貼”專家、國(guó)家教學(xué)名師、中南大學(xué)陳志剛教授出席會(huì)議致歡迎詞。

中南大學(xué)陳志剛教授致歡迎詞
國(guó)家優(yōu)青、長(zhǎng)江學(xué)者、清華大學(xué)任炬副教授針對(duì)現(xiàn)有云端部署模式存在的高計(jì)算開銷與用戶隱私風(fēng)險(xiǎn),提出了端側(cè)智能體架構(gòu) OmniMind,并重點(diǎn)分析了核心技術(shù)挑戰(zhàn)與解決思路。

清華大學(xué)任炬副教授作主旨報(bào)告
青年長(zhǎng)江學(xué)者、南京大學(xué)戴海鵬副教授重點(diǎn)介紹了AI賦能下的視頻分析系統(tǒng)優(yōu)化方案。通過(guò)引入深度強(qiáng)化學(xué)習(xí)與深度神經(jīng)網(wǎng)絡(luò)算法,基于視頻流的時(shí)空相似性,有效降低了視頻處理的延遲與計(jì)算成本。

南京大學(xué)戴海鵬副教授作特邀報(bào)告
上海交通大學(xué)陳諧副教授介紹了開源高質(zhì)量語(yǔ)音合成模型F5-TTS。模型在微軟E2-TTS基礎(chǔ)上進(jìn)行架構(gòu)優(yōu)化,結(jié)合DiT與ConvNeXt V2,并在大規(guī)模語(yǔ)音數(shù)據(jù)集上訓(xùn)練,提升了語(yǔ)音合成的保真度與表現(xiàn)力。

上海交通大學(xué)陳諧副教授作特邀報(bào)告
全球2%頂尖科學(xué)家、蘭卡斯特大學(xué)劉俊教授在人體建模與行為分析方面的系列研究工作。內(nèi)容涵蓋人體動(dòng)作識(shí)別、姿態(tài)估計(jì)、運(yùn)動(dòng)分析及數(shù)字人生成等方向,并介紹了NTU RGB+D與UAV-Human等自主構(gòu)建的重要數(shù)據(jù)集,以及Spatio-Temporal LSTM與DiffPose等關(guān)鍵算法模型,探討了其在機(jī)器人、健康監(jiān)測(cè)、元宇宙等應(yīng)用場(chǎng)景中的實(shí)際應(yīng)用價(jià)值。

蘭卡斯特大學(xué)劉俊教授作特邀報(bào)告
在下午的分會(huì)場(chǎng)報(bào)告中,與會(huì)人員圍繞模式識(shí)別、機(jī)器視覺(jué)與人工智能等相關(guān)會(huì)議主題進(jìn)行了深入研討。我校信息學(xué)院彭自立博士作了題為“Light-VM2D-UNet: A Lightweight UNet Enhanced with Mamba2D for Medical Image Segmentation”的報(bào)告,他從醫(yī)學(xué)圖像分割面臨的挑戰(zhàn)出發(fā),系統(tǒng)介紹了研究團(tuán)隊(duì)所提出的Light-VM2D-UNet解決方案,分析了現(xiàn)有方法的局限性,詳細(xì)講解了其創(chuàng)新的PVM2DRes模塊,通過(guò)集成2D波前掃描機(jī)制和局部上下文增強(qiáng),解決了現(xiàn)有Mamba模型在醫(yī)學(xué)圖像分割中的空間偏差和細(xì)節(jié)保留問(wèn)題,并展示了在三個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果。與會(huì)學(xué)者就模型的優(yōu)勢(shì)和未來(lái)改進(jìn)方向開展了熱烈討論和交流,一致認(rèn)為這項(xiàng)工作為資源受限環(huán)境下的醫(yī)學(xué)圖像分割提供了高效解決方案。

湖南人文科技學(xué)院彭自立博士作口頭報(bào)告
近年來(lái),湖南人文科技學(xué)院信息學(xué)院依托計(jì)算機(jī)科學(xué)與技術(shù)湖南省應(yīng)用特色學(xué)科及湖南省信創(chuàng)產(chǎn)業(yè)學(xué)院平臺(tái),教師團(tuán)隊(duì)緊密跟蹤科研前沿技術(shù),組建了網(wǎng)絡(luò)與計(jì)算智能、人工智能應(yīng)用等多個(gè)科研創(chuàng)新團(tuán)隊(duì)。團(tuán)隊(duì)在邊緣計(jì)算、知識(shí)圖譜、因果推理、疾病識(shí)別、情感計(jì)算及計(jì)算材料學(xué)等領(lǐng)域深入開展研究,在 TMC、TASLP、Neural Networks、Neurocomputing 等權(quán)威期刊上發(fā)表論文20余篇。
(文/圖:唐宇 龔成;一審:李偉民;二審:朱高峰;三審:謝四連)