報告題目:大模型時代下的開放場景視覺感知與理解
報 告 人:尹軍輝 北京郵電大學(xué)人工智能學(xué)院博士后
主 持 人:李蕾 教授
報告時間:2024年12月11日16:00-17:00
騰訊會議:744-3448-1313
報告摘要:
在當(dāng)前人工智能領(lǐng)域,大語言模型因其高度通用化和智能化的表現(xiàn)受到社會廣泛關(guān)注,并逐漸發(fā)展成為機(jī)器學(xué)習(xí)領(lǐng)域重要的研究方向。相比于語言模型的快速發(fā)展,視覺大模型的研究相對滯后。盡管預(yù)訓(xùn)練的視覺大模型借助語言模型的知識表征能力取得了良好的零樣本泛化,但在實際模型推理過程中,并不會提供確切的對象類別名稱。因此,如何將預(yù)訓(xùn)練知識高效快速的遷移到下游各種開放式場景至關(guān)重要。本報告聚焦開放場景下視覺大模型提示生成技術(shù)的發(fā)展現(xiàn)狀與趨勢,探討如何構(gòu)建高效、可解釋、泛化能力強(qiáng)的視覺大模型實際應(yīng)用技術(shù)。
專家簡介:
尹軍輝,北京郵電大學(xué)人工智能學(xué)院博士后、新加坡管理大學(xué)訪問博士后。長期從事多模態(tài)學(xué)習(xí)、視覺感知識別等方向的研究,研究成果在IEEE TIP、PR等國際期刊和會議上發(fā)表,主持國家自然科學(xué)基金青年項目,曾參與國家杰出青年科學(xué)基金、國家優(yōu)秀青年科學(xué)基金、國家重點研發(fā)計劃等項目。獲國家資助博士后研究人員計劃,被評為北京郵電大學(xué)優(yōu)秀博士畢業(yè)生。