
近日,2003网站太阳集团碩士生任林和楊震在EMNLP2023上分别發表兩篇Findings論文。EMNLP(Conference on Empirical Methods in Natural Language Processing)是自然語言處理領域的知名國際會議,由國際計算語言學會(ACL)主辦,是CCF-B類推薦會議。EMNLP 2023于2023年12月6日至10日在新加坡舉行。
錄用的文章如下:
标題:CoVariance-based Causal Debiasing for Entity and Relation Extraction
作者:任林,劉永彬,曹藝馨,歐陽純萍
簡介:此論文緻力于解決關系抽取任務中遇到的長尾分布(long-tail distribution)和分布外泛化(out of distribution)問題。作者提出了一種新穎的協方差和方差優化框架(OVO)。在訓練過程中,該框架通過增加特征各維度之間的獨立性(利用協方差)和增強少樣本标簽在訓練中的影響及标簽間可區分性(利用分組後方差),有效降低了前述問題的影響,并顯著提高了模型的整體性能。
OVO模型圖
标題:Causal Intervention-based Few-Shot Named Entity Recognition
作者:楊震,劉永彬,歐陽純萍
簡介:少樣本命名實體識别(NER)任務旨在有限标注樣本的情況下識别新類的實體。然而,與具有豐富樣本的任務相比,這些任務面臨過拟合的顯著挑戰。這種過拟合主要是由于選擇少數樣本時産生的僞相關。論文提出了一種基于因果幹預的少樣本NER方法。方法基于原型網絡,對上下文進行幹預,以阻斷上下文與标簽之間的後門路徑。對于沒有額外上下文的one-shot場景,論文采用增量學習對原型進行幹預,有助于減輕災難性遺忘。在各種基準測試上的實驗結果表明,提出的方法取得了最優表現。
因果幹預結構圖