科研系学霸

第76章 实则不然

  要说现场能勉强跟得上周昀思路的,除了早就看过论文的邓永华和林院长,那就只有车伟强和那位浙大的答辩老师了,

  至于其他三位老师,也听不明白的,但是却他们不得不硬着头皮去听,因为他们是答辩老师,等会儿可能需要提问题,

  这就让他们有点汗流浃背了,他们也担心等会儿自己提的问题会不会闹出笑话,更别说林院长还坐在后面旁听。

  当PPT放到最后一页的时候,周昀朝台下微微鞠了一躬。

  “以上就是我的主要研究内容,请各位老师批评指正。”

  顿时,整个会议室陷入了一种诡异的寂静,有点大学课堂上老师请学生站起来回答问题,然后大家都默不作声的感觉。

  台下第一排,三位没听懂的老师都很有默契的互相对视了一眼,露出了尴尬的微笑。

  终于,那位浙大老师打破了沉默,让另外三位答辩老师如释重负:“周昀同学,你的毕业论文非常优秀,

  我对你的分成最优传输框架很感兴趣,你提到使用Gromov-Wasserstein距离来处理模态间的几何不一致,

  但能否更深入地解释一下在非欧几里得度量空间中,为什么又要通过FusedGromov-Wasserstein变体来平衡内容和结构对齐?

  此外,在高维嵌入中,你如何通过谱正则化来确保求解的数值稳定性?”

  此时的周昀已经完全地进入了状态,他点了点头:“非常好的问题,GW距离确实擅长捕捉跨域结构相似性,

  但对于多模态语义对齐,我们需要同时考虑特征内容和关系结构,因此我采用了FGW,它结合了经典OT的内容传输和GW的结构匹配。”

  他说着走到讲台旁边,拉过一旁的白板,拿起笔开始边写边讲:“FGW的定义为:FGW_α=OT+αGW,

  其中α∈[0,1]是融合参数,D是内容成本矩阵(如||x-y||p),C_X和C_Y是各自模态的内部相似矩阵,

  在非欧几里得空间中,比如视觉嵌入的球面流形或语言的超双曲空间,我将度量泛化为Riemannian度量

  不知道这是否能解决您的第一个问题?”

  浙大老师点点头:“可以了。”

  周昀点点头,将白板上的内容擦去:“好,那接下来我回答您的第二个问题。”

  马克笔不断在白板上写下各种奇怪的符号,至少在一些旁听的老师和学生眼里是这样的。

  “对于高维嵌入的数值稳定性,维度灾难会导致C_X和C_Y的谱不稳定,我引入了谱正则化:对相似矩阵施加核范数罚项,min||C||+λ

  这样就能这确保了在噪声环境下,FGW的梯度下降不会发散,实验中在ImageNet-1K上的鲁棒性提升(本章未完,请翻页)

  请收藏本站:https://www.bqgde.de。一起小说吧手机版:https://m.bqgde.de