O lista organizata a resurselor Open Information Extraction (OIE): lucrari de cercetare, cod, date, aplicatii etc. Lista nu se limiteaza exclusiv la sistemele Open Information Extraction. De asemenea, include lucrari extrem de legate de OIE, cum ar fi taxonomizarea relatiilor deschise si utilizarea OIE in aplicatiile din aval.

Cuprins

  • Introducere in OIE
  • Lucrari sortate in ordine cronologica
    • 2006
    • 2007
    • 2008
    • 2009
    • 2010
    • 2011
    • 2012
    • 2013
    • 2014
    • 2015
    • 2016
    • 2017
    • 2018
    • 2019
    • 2020
    • 2021
  • Lucrari grupate pe categorii
    • Sondaje
    • Evaluare
    • OIE pentru aplicatiile din aval
      • Raspuns la intrebare
      • Umplere slot
      • Inducerea schemei de evenimente
      • Rezumarea textului
      • Populatia bazei de cunostinte
      • Constructia bazei de cunostinte
      • Entitati conexe
    • OIE in diferite limbi
      • Sisteme OIE pentru limba germana
      • Sisteme OIE pentru limba portugheza
      • Sisteme OIE pentru limba spaniola
      • Sisteme OIE pentru limba chineza
      • Sisteme OIE pentru limba persana
      • Sisteme OIE pentru limba italiana
      • Sisteme OIE pentru limba indoneziana
    • OIE supravegheat
    • Canonicalizarea OIE
  • Diapozitive
  • Discutii
  • Cod
  • Date
    • Corporatii OIE
    • Resurse derivate din rezultatul OIE
  • Teze de doctorat
  • Demonstratii

Introducere in OIE

Sistemele Open Information Extraction (OIE) isi propun sa extraga relatiile nevazute si argumentele lor din textul nestructurat intr-o maniera nesupravegheata. In forma sa cea mai simpla, avand o propozitie in limbaj natural, ei extrag informatii sub forma unui triplu, format din subiect (S), relatie (R) si obiect (O).

Sa presupunem ca avem urmatoarea propozitie de intrare:

AMD, cu sediul in SUA, este o companie de tehnologie.

Un sistem OIE isi propune sa faca urmatoarele extractii:

(“AMD”; “are sediul in”; “SUA”) (“AMD”; “este”; “companie de tehnologie”)

Lucrari sortate in ordine cronologica

2006

  • „Citirea masinii” – AAAI 2006

    Oren Etzioni, Michele Banko, Michael J. Cafarella

2007

  • „Extragerea informatiilor deschise de pe web” – IJCAI 2007

    Michele Banko, Michael J. Cafarella, Stephen Soderland, Matthew Broadhead, Oren Etzioni

  • „Rezolutia nesupravegheata a obiectelor si a relatiilor de pe web” – NAACL 2007

    Alexander Yates, Oren Etzioni

  • „TextRunner: extragerea informatiilor deschise pe web” – HLT-NAACL 2007

    Alexander Yates, Michele Banko, Matthew Broadhead, Michael J. Cafarella, Oren Etzioni, Stephen Soderland

2008

  • „Compensarile dintre extractia relatiei deschise si traditionale” – ACL 2008

    Michele Banko, Oren Etzioni

  • „Extragerea cunostintelor deschise prin procesarea limbajului compozitional” – STEP 2008

    Benjamin Van Durme, Lenhart K. Schubert

  • „Extragerea informatiilor deschise de pe web” – Comun. ACM 2008

    Oren Etzioni, Michele Banko, Stephen Soderland, Daniel S. Weld

2009

  • „Utilizarea Wikipedia pentru a bootstrap extragerea informatiilor deschise” – SIGMOD 2009

    Daniel S. Weld, Raphael Hoffmann, Fei Wu

2010

  • „Extragerea informatiilor deschise folosind Wikipedia” – ACL 2010

    Fei Wu, Daniel S. Weld

  • „Identificarea relatiilor functionale in textul web” – EMNLP 2010

    Thomas Lin, Mausam, Oren Etzioni

  • „Adaptarea extragerii informatiilor deschise la relatiile specifice domeniului” – Revista AI (31), 2010

    Stephen Soderland, Brendan Roof, Bo Qin, Shi Xu, Mausam, Oren Etzioni

2011

  • „Extragerea informatiilor deschise: a doua generatie” – IJCAI 2011 (diapozitive)

    Oren Etzioni, Anthony Fader, Janara Christensen, Stephen Soderland, Mausam

  • „Identificarea relatiilor pentru extragerea informatiilor deschise” – EMNLP 2011 (resurse (cod, date))

    Anthony Fader, Stephen Soderland, Oren Etzioni

  • „Filtrarea si clusterizarea relatiilor pentru extragerea informatiilor nesupravegheate in domeniu deschis” – CIKM 2011

    Wei Wang, Romaric Besancon, Olivier Ferret, Brigitte Grau

  • „O analiza a extragerii informatiilor deschise bazata pe etichetarea rolului semantic” – K-CAP 2011

    Janara Christensen, Mausam, Stephen Soderland, Oren Etzioni

2012

  • „Invatarea limbilor deschise pentru extragerea informatiilor” – EMNLP-CoNLL 2012 (resurse (cod, date, binare))

    Mausam, Michael Schmitz, Stephen Soderland, Robert Bart, Oren Etzioni

  • „PATTY: O taxonomie a tiparelor relationale cu tipuri semantice” – EMNLP-CoNLL 2012

    Ndapandula Nakashole, Gerhard Weikum, Fabian M. Suchanek

  • “Semantica ansamblului pentru extractia relatiei pe scara larga fara supraveghere – EMNLP-CoNLL 2012

    Bonan Min, Shuming Shi, Ralph Grishman, Chin-Yew Lin

  • „WiSeNet: construirea unei retele semantice bazate pe Wikipedia cu relatii ontologizate” – CIKM 2012 (resurse)

    Andrea Moro, Roberto Navigli

  • „Extragerea informatiilor deschise pentru limbajul SOV bazat pe detectarea perechii entitati-predicate” – COLING 2012

    Woong-Ki Lee, Yeon-Su Lee, Hyoung-Gyu Lee, Won-Ho Ryu, Hae-Chang Rim

  • „O schema de ponderare pentru extragerea informatiilor deschise” – HLT-NAACL 2012

    Yuval Merhav

  • „Extractia informatiilor deschise bazate pe dependenta” – Atelier comun privind invatarea nesupravegheata si semisupravegheata in PNL @ ACL 2012

    Pablo Gamallo, Marcos Garcia

  • „KrakeN: N-ary Facts in Open Information Extraction” – AKBC-WEKEX @ NAACL-HLT 2012

    Alan Akbik, Alexander Loser

  • „Imbunatatirea extragerii informatiilor deschise pentru documente web informale cu reguli Ripple-Down” – PKAW 2012

    Myung Hee Kim, Paul Compton

2013

  • „ClausIE: extragerea informatiilor deschise bazate pe clauze” – WWW 2013 (diapozitive, cod, toate resursele)

    Luciano Del Corro, Rainer Gemulla

  • “Integrarea analizei sintactice si semantice in paradigma de extragere a informatiilor deschise” – IJCAI 2013 (resurse)

    Andrea Moro, Roberto Navigli

  • „Eficacitatea si eficienta extractiei relatiei deschise” – EMNLP 2013 (cod)

    Filipe de Sa Mesquita, Jordan Schmidek, Denilson Barbosa

  • „Extragerea informatiilor deschise cu miez de copac” – HLT-NAACL 2013

    Ying Xu, Mi-Young Kim, Kevin Quinn, Randy Goebel, Denilson Barbosa

  • „Extractia relatiei cu factorizarea matriciala si scheme universale” – HLT-NAACL 2013

    Sebastian Riedel, Limin Yao, Andrew McCallum, Benjamin M. Marlin

  • „Extragerea informatiilor deschise prin descompunerea contextuala a frazelor” – ICSC 2013

    Hannah Bast, Elmar Haussmann

  • „Integrarea extragerii de informatii deschise si inchise: provocari si primii pasi” – NLP-DBPEDIA @ ISWC 2013

    Arnab Dutta, Christian Meilicke, Mathias Niepert, Simone Paolo Ponzetto

  • „Extragerea informatiilor deschise catre relatiile KBP in 3 ore” – TAC 2013

    Stephen Soderland, John Gilmer, Robert Bart, Oren Etzioni, Daniel S. Weld

2014

  • „Substantiv: extragerea faptelor pentru atributele nominale” – EMNLP 2014

    Mohamed Yahya, Steven Whang, Rahul Gupta, Alon Y. Halevy

  • „ZORE: Un sistem bazat pe sintaxa pentru extragerea relatiei deschise din China” – EMNLP 2014

    Likun Qiu, Yue Zhang

  • „Canonicalizarea bazelor de cunoastere deschise” – CIKM 2014

    Luis Galarraga, Geremy Heitz, Kevin Murphy, Fabian M. Suchanek

  • “Graficele de reducere a focalizarii pentru propunerile Open IE” – CoNLL 2014

    Omer Levy, Ido Dagan, Jacob Goldberger

  • „Stimularea extragerii informatiilor deschise cu relatii bazate pe substantiv” – LREC 2014

    Clarissa Castella Xavier, Vera Lucia Strube de Lima

  • „Imbunatatirea extractiei relatiei deschise prin restructurarea frazelor – LREC 2014

    Jordan Schmidek, Denilson Barbosa

  • „Extragere mai informativa a informatiilor deschise prin inferenta simpla” – ECIR 2014

    Hannah Bast, Elmar Haussmann

  • „Semantificarea triplelor din sistemele de extractie a informatiilor deschise” – SCARI 2014

    Arnab Dutta, Christian Meilicke, Heiner Stuckenschmidt

  • „Rezolutia coreferentei centrate pe entitati a entitatilor persoane pentru extragerea informatiilor deschise” – Procesamiento del Lenguaje Natural (2014)

    Marcos Garcia, Pablo Gamallo

  • „Extragerea informatiilor deschise pentru limba spaniola pe baza constrangerilor sintactice” – ACL (Student Research Workshop) (2014)

    Alisa Zhila, Alexander Gelbukh

2015

  • „Utilizarea structurii lingvistice pentru extragerea informatiilor pe domenii deschise” – ACL 2015 (cod (Java), cod (Python))

    Gabor Angeli, Melvin Jose Johnson Premkumar, Christopher D. Manning

  • „Deschideti IE ca structura intermediara pentru sarcini semantice” – ACL 2015

    Gabriel Stanovsky, Ido Dagan, Mausam

  • „Extragerea informatiilor pe scara larga din definitiile textuale prin analize sintactice si semantice profunde” – TACL 2015 (resurse)

    Claudio Delli Bovi, Luca Telesca, Roberto Navigli

  • Inferirea schemelor de relatii binare pentru extragerea informatiilor deschise” – EMNLP 2015

    Kangqi Luo, Xusheng Luo, Kenny Qili Zhu

  • “Unificarea bazei de cunostinte prin Sense Embeddings si Disambiguation” – EMNLP 2015 (resurse)

    Claudio Delli Bovi, Luis Espinosa Anke, Roberto Navigli

  • „CORE: Extractie de relatii deschise constiente de context cu masini de factorizare” – EMNLP 2015 (cod)

    Fabio Petroni, Luciano Del Corro, Rainer Gemulla

  • „Extractia multilingva a relatiilor deschise folosind proiectia trans-linguala” – HLT-NAACL 2015

    Manaal Faruqui, Shankar Kumar

  • „Imbogatirea cunostintelor structurate cu informatii deschise” – WWW 2015

    Arnab Dutta, Christian Meilicke, Heiner Stuckenschmidt

  • „SRDF: Extractia informatiilor deschise coreene folosind proprietatea Singleton” – ISWC 2015

    Sangha Nam, YoungGyun Hahm, Sejin Nam, Key-Sun Choi

  • „Extragerea informatiilor deschise multilingve” – EPIA 2015

    Pablo Gamallo, Marcos Garcia

  • „Extragerea informatiilor deschise bazate pe semantica lexicala” – J. Braz. Comp. Soc. 21 2015

    Clarissa Castella Xavier, Vera Lucia Strube de Lima, Marlo Souza

2016

  • „Propuneri imbricate in extragerea informatiilor deschise” – EMNLP 2016 (discutie)

    Nikita Bhutani, HV Jagadish, Dragomir R. Radev

  • „Crearea unui benchmark mare pentru extragerea informatiilor deschise” – EMNLP 2016 (cod, discutie)

    Gabriel Stanovsky, Ido Dagan

  • „Portarea unui sistem deschis de extragere a informatiilor din engleza in germana” – EMNLP 2016 (cod)

    Tobias Falke, Gabriel Stanovsky, Iryna Gurevych, Ido Dagan

  • „Inducerea schemei de relatii folosind factorizarea tensorului cu informatii laterale” – EMNLP 2016

    Madhav Nimishakavi, Uday Singh Saini, Partha P. Talukdar

  • „Sisteme de extragere a informatiilor deschise si aplicatii din aval” – IJCAI 2016

    Mausam

  • „Demonimele si substantivele relationale compuse in IE deschis nominal” – AKBC @ NAACL-HLT 2016

    Harinder Pal, Mausam

  • „O metoda de extragere a informatiilor deschise bazate pe reguli folosind traductorul in stare finita in cascada – PAKDD 2016

    Hailun Lin, Yuanzhuo Wang, Peng Zhang, Weiping Wang, Yinliang Yue, Zheng Lin

  • „Mai mult din sintaxa cu PropS” – CoRR (2016)

    Gabriel Stanovsky, Jessica Ficler, Ido Dagan, Yoav Goldberg

  • „Imbunatatirea extragerii informatiilor deschise pentru sarcinile web semantice” – Trans. Inteligenta colectiva computationala 21, 2016

    Cheikh Kacfah Emani, Catarina Ferreira Da Silva, Bruno Fies, Parisa Ghodous

  • „O abordare informativa pentru evaluarea IE deschisa” – CICLing 2016 (diapozitive, cod + date)

    William Lechelle, Philippe Langlais

2017

  • „MinIE: Minimizarea faptelor in extragerea informatiilor deschise” – EMNLP 2017 (cod, afis, toate resursele)

    Kiril Gashteovski, Rainer Gemulla, Luciano Del Corro

  • „Raspunsul la intrebari complexe folosind extragerea informatiilor deschise” – ACL 2017

    Tushar Khot, Ashish Sabharwal, Peter Clark

  • „Populatia bazei de cunostinte de buzunar” – ACL 2017

    Travis Wolfe, Mark Dredze, Benjamin Van Durme

  • „Bootstrapping for Numerical Open IE” – ACL 2017

    Swarnadeep Saha, Harinder Pal, Mausam

  • „MT / IE: Extragerea informatiilor deschise trans-lingvistice cu modele neuronale de secventa la secventa” – EACL 2017 (cod)

    Kevin Duh, Benjamin Van Durme, Sheng Zhang

  • Extractia relatiei deschise pentru recuperarea pasajelor de asistenta: merit si probleme deschise “ – SIGIR 2017

    Amina Kadry, Laura Dietz

  • „Invatarea reprezentarii sintactice pentru extragerea informatiilor deschise pe web” – WWW 2017

    Chengsen Ru, Jintao Tang, Shasha Li, Ting Wang

  • „MetaPAD: Meta Pattern Discovery from Massive Text Corpora” (cod) – KDD 2017

    Meng Jiang, Jingbo Shang, Taylor Cassidy, Xiang Ren, Lance M. Kaplan, Timothy P. Hanratty, Jiawei Han

  • „RelVis: Benchmarking OpenIE Systems” – ISWC 2017

    Rudolf Schneider, Tom Oberhauser, Tobias Klatt, Felix A. Gers, Alexander Loser

  • „Extractia si punerea la pamant a unei relatii deschise” – IJCNLP 2017

    Dian Yu, Lifu Huang, Heng Ji

  • „Decodare selectiva pentru extragerea informatiilor deschise in mai multe limbi” – IJCNLP (1) 2017

    Sheng Zhang, Kevin Duh, Benjamin Van Durme

  • „O evaluare a sistemelor de extractie a relatiei deschise pentru reteaua semantica” – Inf. Syst. 71, 2017

    Amal Zouaq, Michel Gagnon, Ludovic Jean-Louis

  • „O evaluare a PredPatt si Open IE prin Etapa 1 Etichetarea rolului semantic” – IWCS 2017

    Sheng Zhang, Rachel Rudinger, Benjamin Van Durme

  • „Descoperirea frazelor relationale pentru rolurile Qualia prin extragerea informatiilor deschise” – KESW 2017

    Giovanni Siragusa, Valentina Leone, Luigi Di Caro, Claudio Schifanella

  • „Extractia relatiei deschise bazata pe clusterizarea frazelor de dependenta de baza” – DSC 2017

    Chengsen Ru, Shasha Li, Jintao Tang, Yi Gao, Ting Wang

  • „Analizarea erorilor sistemelor deschise de extragere a informatiilor” – Atelier de lucru pentru construirea sistemelor NLP generalizabile lingvistic @ EMNLP 2017

    Rudolf Schneider, Tom Oberhauser, Tobias Klatt, Felix A. Gers, Alexander Loser

2018

  • „Logician: O abordare neuronala end-to-end unificata pentru extragerea informatiilor in domeniu deschis” – WSDM 2018

    Mingming Sun, Xu Li, Xin Wang, Miao Fan, Yue Feng, Ping Li

  • „QA bazat pe afirmatii cu extragerea informatiilor deschise care constientizeaza intrebarile” – AAAI 2018

    Zhao Yan, Duyu Tang, Nan Duan, Shujie Liu, Wendi Wang, Daxin Jiang, Ming Zhou, Zhoujun Li

  • „Extractia informatiilor deschise neuronale” – ACL 2018

    Lei Cui, Furu Wei, Ming Zhou

  • „Extragerea informatiilor deschise supravegheate” – NAACL-HLT 2018

    Gabriel Stanovsky, Julian Michael, Luke Zettlemoyer, Ido Dagan

  • „Logician si orator: invatarea din dualitatea dintre limba si cunostinte in domeniul deschis” – EMNLP 2018

    Mingming Sun, Xu Li, Ping Li

  • „Extragerea informatiilor deschise din propozitiile conjunctive” – COLING 2018

    Swarnadeep Saha, Mausam

  • „Grafen: propuneri legate semantic in extragerea informatiilor deschise” – COLING 2018 (cod, documentatie)

    Matthias Cetto, Christina Niklaus, Andre Freitas, Siegfried Handschuh

  • „Extragerea informatiilor deschise asupra textului stiintific: o evaluare” – COLING 2018

    Paul T. Groth, Michael Lauruhn, Antony Scerri, Ron Daniel

  • „Un sondaj privind extragerea informatiilor deschise” – COLING 2018

    Christina Niklaus, Matthias Cetto, Andre Freitas, Siegfried Handschuh

  • „StuffIE: Etichetarea semantica a fatetelor neetichetate folosind extractia informatiei cu granulatie fina” – CIKM 2018

    Radityo Eko Prasojo, Mouna Kacimi, Werner Nutt

  • „Catre o canonizare a bazei de cunostinte deschise practice” – CIKM 2018

    Tien-Hsuan Wu, Zhiyong Wu, Ben Kao, Pengcheng Yin

  • „Extragerea informatiilor deschise cu constrangeri de structura globala” – WWW 2018

    Qi Zhu, Xiang Ren, Jingbo Shang, Yu Zhang, Frank F. Xu, Jiawei Han

  • „CESI: Canonicalizarea bazelor de cunostinte deschise folosind incorporari si informatii laterale” – WWW 2018 (cod)

    Shikhar Vashishth, Printul Jain, Partha Talukdar

  • „Revizuirea sarcinii de notare a relatiilor IE deschise” (poster) – LREC 2018

    William Lechelle, Philippe Langlais

  • „Utilizarea contextului semantic pentru evaluarea extragerii informatiilor rare” – TKDD 2018 (resurse)

    Pei-Pei Li, Haixun Wang, Hongsong Li, Xindong Wu

  • „Extragerea informatiilor deschise cu descoperirea meta-modelului in literatura biomedicala” – BCB 2018

    Xuan Wang, Yu Zhang, Qi Li, Yinyin Chen, Jiawei Han

  • „Modelarea si rezumarea evenimentelor de stiri cu ajutorul triplelor semantice” – ESWC 2018

    Radityo Eko Prasojo, Mouna Kacimi, Werner Nutt

  • „Dezambiguizarea IE deschis: identificarea similitudinii semantice in extractia relatiei prin incorporari de cuvinte” – PROPOR 2018

    Leandro MP Sanches, Victor S. Cardel, Larissa S. Machado, Marlo Souza, Lais do Nascimento Salvador

  • „Evaluarea orientata spre sarcini a analizei dependentei cu extragerea informatiilor deschise” – PROPOR 2018

    Pablo Gamallo, Marcos Garcia

  • „Provocarile unei sarcini de adnotare pentru extragerea informatiilor deschise in portugheza” – PROPOR 2018

    Rafael Glauber, Leandro Souza de Oliveira, Cleiton Fernando Lima Sena, Daniela Barreiro Claro, Marlo Souza

  • „Un studiu sistematic de cartografiere privind extragerea informatiilor deschise” – Expert Syst. Aplic. 2018

    Rafael Glauber, Daniela Barreiro Claro

  • „Auto-instruire asupra modelelor de clauze rafinate pentru extragerea relatiei” – Inf. Proces. Administra. 54 (4): 686-706 (2018)

    Duc-Thuan Vo, Ebrahim Bagheri

  • „Modele neuronale supravegheate revitalizeaza extractia relatiei deschise” – CoRR 2018

    Shengbin Jia, Yang Xiang, Xiaojun Chen

  • „Extragerea relatiei deschise chineze si stabilirea bazei de cunostinte” – ACM Trans. Lang asiatic si cu resurse reduse. Inf. Proces. 2018 (diapozitive, cod)

    Shengbin Jia, Shijia E, Maozhen Li, Yang Xiang

  • Extragerea informatiilor deschise indoneziene bazate pe reguli “ – ICAICTA 2018

    Ade Romadhony, Ayu Purwarianti, Dwi H. Widyantoro

  • „WiRe57: Un benchmark cu granulatie fina pentru extragerea informatiilor deschise” – CoRR 2018

    William Lechelle, Fabrizio Gotti, Philippe Langlais

2019

  • „OPIEC: An Open Information Extraction Corpus” – AKBC 2019 (date + resurse, cod (citire date), cod (conducta))

    Kiril Gashteovski, Sebastian Wanner, Sven Hertling, Samuel Broscheit, Rainer Gemulla

  • „MinScIE: Extragerea informatiilor deschise centrate pe citatie – JCDL 2019 (cod)

    Anne Lauscher, Yide Song, Kiril Gashteovski

  • „EAL: un set de instrumente si un set de date pentru conectarea intre entitati si aspecte” – JCDL 2019 (date, cod, demo)

    Federico Nanni, Jingyi Zhang, Ferdinand Betz, Kiril Gashteovski

  • „Integrarea contextului local si a coezivitatii globale pentru extragerea informatiilor deschise” – WSDM 2019 (cod)

    Qi Zhu, Xiang Ren, Jingbo Shang, Yu Zhang, Ahmed El-Kishky, Jiawei Han

  • „Extragerea informatiilor deschise din perechile intrebare-raspuns” – NAACL 2019

    Nikita Bhutani, Yoshihiko Suhara, Wang-Chiew Tan, Alon Halevy si HV Jagadish

  • „OpenKI: Integrarea extragerii informatiilor deschise si a bazelor de cunostinte cu inferenta relatiei” – NAACL 2019 (date)

    Dongxu Zhang, Subhabrata Mukherjee, Colin Lockard, Xin Luna Dong, Andrew McCallum

  • „OpenCeres: Cand extragerea informatiilor deschise se intalneste cu webul semi-structurat” – NAACL 2019 (video, diapozitive, date)

    Colin Lockard, Prashant Shiralkar si Xin Luna Dong

  • „Imbunatatirea extragerii informatiilor deschise prin invatarea Iterative Rank-Aware” – ACL 2019 (cod)

    Zhengbao Jiang, Pengcheng Yin si Graham Neubig

  • „Extractia relatiei deschise: transfer de cunostinte relationale de la date supravegheate la date nesupravegheate” – EMNLP 2019

    Ruidong Wu, Yuan Yao, Xu Han, Ruobing Xie, Zhiyuan Liu, Fen Lin, Leyu Lin si Maosong Sun

  • „Supravegherea modelelor de extractie a informatiilor deschise nesupravegheate” – EMNLP 2019

    Arpita Roy, Youngja Park, Taesung Lee si Shimei Pan

  • „CaRB: un criteriu de referinta colectiv pentru Open IE” – EMNLP 2019 (cod si date)

    Sangnie Bhardwaj, Samarth Aggarwal si Mausam

  • „CaRe: Incorporari grafice de cunostinte deschise” – EMNLP 2019 (cod)

    Swapnil Gupta, Sreyash Kenkre, Partha Talukdar

  • „Invatarea colaborativa a politicilor pentru rationamentul grafic al cunostintelor deschise” – EMNLP 2019 (cod)

    Cong Fu, Tong Chen, Meng Qu, Woojeong Jin, Xiang Ren

  • „Etichetare in secventa multi-iesire multi-intrare pentru extragerea in comun a tupelor de fapt si conditie din textul stiintific” – EMNLP 2019

    Tianwen Jiang, Tong Zhao, Bing Qin, Ting Liu, Nitesh Chawla, Meng Jiang

  • „Rolul„ conditiei ”: un nou model de reprezentare si constructie a graficului cunostintelor stiintifice” – KDD 2019

    Tianwen Jiang, Tong Zhao, Bing Qin, Ting Liu, Nitesh V. Chawla, Meng Jiang

  • „Canonicalizarea bazelor de cunoastere deschise cu informatii laterale din textul sursa” – ICDE 2019

    Xueling Lin, Lei Chen

  • „Extractia relatiei deschise pentru frazele substantivelor chinezesti” – TKDE 2019

    Chengyu Wang, Xiaofeng He, Aoying Zhou

  • „Divizarea si extragerea – separarea clauzei de separare si extragerea propunerii” – RANLP 2019

    Darina Gold, Torsten Zesch

  • „Exploatarea IE deschis pentru obtinerea corpusului de reducere a premiselor multiple” – RANLP 2019

    Martin Vita, Jakub Klimek

  • „Extragerea informatiilor deschise bazate pe lexic-gramatica din propozitiile in limbaj natural in limba italiana” – Sisteme si aplicatii expert 2019

    Raffaele Guarasci, Emanuele Damiano, Aniello Minutolo, Massimo Esposito, Giuseppe De Pietro

  • „Achizitia de reguli pentru extragerea informatiilor deschise, supravegheata slab, bazata pe date” – CAIAC 2019

    Fabrizio Gotti E-mail, Philippe Langlais

  • „Alinierea relatiilor IE deschise si a relatiilor KB utilizand o retea siameza bazata pe incorporarea cuvintelor” – ICCS 2019

    Rifki Afina Putri, Giwon Hong, Sung-Hyon Myaeng

  • „Incorporari de cuvinte contextualizate intr-un model de extractie a informatiilor deschise neuronale” – NLDB 2019

    Injy Sarhan, Marco R. Spruit

  • „Extragerea informatiilor deschise multilingve: provocari si oportunitati” – informatii 10 (7): 228, 2019

    Daniela Barreiro Claro, Marlo Souza, Clarissa Castella Xavier, Leandro Souza de Oliveira

  • „CTGA: Cautare literatura biomedicala bazata pe grafice” – Conferinta internationala IEEE despre bioinformatica si biomedicina (BIBM)

    Tianwen Jiang, Zhihan Zhang, Tong Zhao, Bing Qin, Ting Liu, Nitesh V. Chawla, Meng Jiang

  • „Cand Lexicon-Grammar intalneste extragerea informatiilor deschise: un experiment computational pentru propozitiile italiene” – CLiC-it 2019

    Raffaele Guarasci, Emanuele Damiano, Aniello Minutolo, Massimo Esposito

  • „Catre un set de date standard pentru extragerea informatiilor deschise in limba italiana” – SNAMS 2019

    Raffaele Guarasci, Emanuele Damiano, Aniello Minutolo, Massimo Esposito

  • „Co-Clustering Triples from Open Information Extraction” – COMAD 2019

    Koninika Pal, Vinh Thinh Ho, Gerhard Weikum

  • Mineritatea relatiilor multi-documente bazate pe coerenta si salienta – APWeb-WAIM 2019

    Yongpan Sheng, Zenglin Xu

  • „Invatarea extractiei informatiilor deschise a relatiilor implicite din citirea seturilor de date de intelegere” – CoRR 2019

    Jacob Beckerman, Theodore Christakis

2020

  • Comparatie sistematica a arhitecturilor neuronale si a abordarilor de instruire pentru extragerea informatiilor deschise – EMNLP 2020

    Patrick Hohenecker, Frank Mtumbuka, Vid Kocijan, Thomas Lukasiewicz

  • O adnotare a argumentului functiei-predicat al limbajului natural pentru e- expresia informatiilor in domeniu deschis – EMNLP 2020 (resurse)

    Mingming Sun, Wenyue Hua, Zoey Liu, Xin Wang, Kangjie Zheng, Ping Li

  • Comparatie sistematica a arhitecturilor neuronale si a abordarilor de instruire pentru extragerea informatiilor deschise – EMNLP 2020

    Patrick Hohenecker, Frank Mtumbuka, Vid Kocijan, Thomas Lukasiewicz

  • SelfORE: Invatare functionala relationala auto-supravegheata pentru extractia relatiei deschise – EMNLP 2020

    Xuming Hu, Chenwei Zhang, Yusong Xu, Lijie Wen, Philip S. Yu

  • „OpenIE6: Etichetarea retelei iterative si analiza coordonarii pentru extragerea informatiilor deschise” (cod) – EMNLP 2020

    Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti

  • „Multi2OIE: Extragere multilingva de informatii deschise bazata pe atentia multi-cap cu BERT” (cod) – EMNLP 2020

    Youngbin Ro, Yukyung Lee, Pilsung Kang

  • „Despre alinierea extractiilor OpenIE cu bazele de cunostinte: un studiu de caz” (video, diapozitive, resurse) – Eval4NLP @ EMNLP 2020

    Kiril Gashteovski, Rainer Gemulla, Bhushan Kotnis, Sven Hertling, Christian Meilicke

  • „IMoJIE: Extragere comuna a informatiilor deschise bazate pe memorie iterativa” (cod, video) – ACL 2020

    Keshav Kolluru, Samarth Aggarwal, Vipul Rathore, Mausam, Soumen Chakrabarti

  • „Putem prezice noi fapte cu incorporari in grafic de cunostinte deschise? Un punct de referinta pentru predictia de legaturi deschise” (resurse, videoclip) – ACL 2020

    Samuel Broscheit, Kiril Gashteovski, Yanjie Wang, Rainer Gemulla

  • „Invatarea relatiilor interpretabile intre entitati, relatii si concepte prin structura bayesiana Invatarea asupra faptelor de domeniu deschis” (video) – ACL 2020

    Jingyuan Zhang, Mingming Sun, Yue Feng, Ping Li

  • „In termenii Layman: extragerea relatiilor semi-deschise din textele stiintifice” (cod, video) – ACL 2020

    Ruben Kruiper, Julian Vincent, Jessica Chen-Burger, Marc Desmulliez, Ioannis Konstas

  • „Model de extindere pentru extragerea informatiilor deschise pe corpus precis” (cod) – AAAI 2020

    Junlang Zhan, Hai Zhao

  • „LOREM: Extragere de relatie deschisa compatibila cu limbajul din text nestructurat” (cod) – WWW 2020

    Tom Harting, Sepideh Mesbah, Christoph Lofi

  • „Extragerea cunostintelor din textul web cu cautarea in arbore Monte Carlo” – WWW 2020

    Guiliang Liu, Xu Li, Jiakang Wang, Mingming Sun, Ping Li

  • „MULCE: Canonicalizare pe mai multe niveluri cu incorporari de baze de cunoastere deschise” – WISE 2020

    Tien-Hsuan Wu, Ben Kao, Zhiyong Wu, Xiyang Feng, Qianli Song, Cheng Chen

  • Un algoritm avantaj-actor-critic cu explorare de incredere pentru extragerea informatiilor deschise “ – SDM 2020

    Guiliang Liu, Xu Li, Miningming Sun, Ping Li

  • „Extractia relatiei deschise din China cu retele de generatoare de pointer” – DSC 2020

    Ziheng Cheng, Xu Wu, Xiaqing Xie, Jingchen Wu

  • Clasificator OpenIE explicabil cu reguli morfo-sintactice “ – HI4NLP @ ECAI 2020

    Bruno Cabral, Marlo Souza, Daniela Barreiro Claro

  • „Model de etichetare neuronala hibrida pentru extractia relatiei deschise” – CoRR 2020 (date)

    Shengbin Jia, Yang Xiang

  • „Canonicalizarea bazelor de cunostinte deschise cu retea neuronala multi-stratificat cu grafice” – CoRR 2020

    Tianwen Jiang, Tong Zhao, Bing Qin, Ting Liu, Nitesh V. Chawla, Meng Jiang

  • „Etichetati si corectati: extragerea informatiilor deschise constiente de intrebari cu decodare in doua etape” – CoRR 2020

    Martin Kuo, Yaobo Liang, Lei Ji, Nan Duan, Linjun Shou, Ming Gong, Peng Chen

  • „Rezumare axata pe interogari abstracte cu resurse fara interogari” – CoRR 2020

    Yumo Xu, Mirella Lapata

2021

  • „Retea neuronala cu grafic de dependenta multi- grained pentru extragerea informatiilor deschise din China” – PAKDD 2021

    Zhiheng Lyu, Kaijie Shi, Xin Li, Lei Hou, Juanzi Li, Binheng Song

Lucrari grupate pe categorii

Sondaje

  • „Sisteme de extragere a informatiilor deschise si aplicatii din aval” – IJCAI 2016

    Mausam

  • „Un sondaj privind extragerea informatiilor deschise” – COLING 2018

    Christina Niklaus, Matthias Cetto, Andre Freitas, Siegfried Handschuh

  • „Un studiu sistematic de cartografiere privind extragerea informatiilor deschise” – Expert Syst. Aplic. 2018

    Rafael Glauber, Daniela Barreiro Claro

  • „Extragerea informatiilor deschise multilingve: provocari si oportunitati” – informatii 10 (7): 228, 2019

    Daniela Barreiro Claro, Marlo Souza, Clarissa Castella Xavier, Leandro Souza de Oliveira

Evaluare

OIE pentru aplicatiile din aval

S-a dovedit ca productia OIE este o intrare utila pentru multe sarcini din aval. In aceasta sectiune, sunt enumerate mai multe sarcini din aval care au beneficiat de rezultatul OIE.

Raspuns la intrebare

  • „QA bazat pe afirmatii cu extragerea informatiilor deschise, constiente de intrebari” AAAI 2018

    Zhao Yan, Duyu Tang, Nan Duan, Shujie Liu, Wendi Wang, Daxin Jiang, Ming Zhou, Zhoujun Li

  • „Raspunsul la intrebari complexe folosind extragerea informatiilor deschise” – ACL 2017

    Tushar Khot, Ashish Sabharwal, Peter Clark

  • „Invatare bazata pe parafraza pentru raspuns la intrebari deschise” ACL 2013

    Anthony Fader, Luke S. Zettlemoyer, Oren Etzioni

Umplere slot

  • „Extragerea informatiilor deschise catre relatiile KBP in 3 ore” – TAC 2013

    Stephen Soderland, John Gilmer, Robert Bart, Oren Etzioni, Daniel S. Weld

  • „Utilizarea structurii lingvistice pentru extragerea informatiilor pe domenii deschise” – ACL 2015 (cod (Java), cod (Python))

    Gabor Angeli, Melvin Jose Johnson Premkumar, Christopher D. Manning

  • „Sistemul Universitatii din Washington pentru 2015 KBP Umplerea sloturilor de pornire la rece” – TAC 2015

    Stephen Soderland, Natalie Hawkins, Gene L. Kim, Daniel S. Weld

  • „Combinarea IE deschis si supravegherea la distanta pentru umplerea sloturilor KBP” – TAC 2015

    Stephen Soderland, Natalie Hawkins, John Gilmer, Daniel S. Weld

  • „Extractia si punerea la pamant a unei relatii deschise” – IJCNLP 2017

    Dian Yu, Lifu Huang, Heng Ji

Inducerea schemei de evenimente

  • „Generarea unor scheme de evenimente coerente la scara” – EMNLP 2013

    Niranjan Balasubramanian, Stephen Soderland, Mausam, Oren Etzioni

Rezumarea textului

  • „Fapte care conteaza” – EMNLP 2018

    Marco Ponza, Luciano Del Corro, Gerhard Weikum

  • „Exploatarea relatiilor multi-document bazate pe coerenta si evidenta” – APWeb-WAIM 2019

    Yongpan Sheng, Zenglin Xu

  • „FAR-ASS: Sintetizarea abstracta a propozitiilor abstracte consolidate” – Procesarea si gestionarea informatiilor 2021

    Mengli Zhanga, Gang Zhoua, Wanting Yua, Wenfen Liu

  • „Rezumare axata pe interogari abstracte cu resurse fara interogari” – CoRR 2020

    Yumo Xu, Mirella Lapata

Populatia bazei de cunostinte

  • „Populatia bazei de cunostinte de buzunar” – ACL 2017

    Travis Wolfe, Mark Dredze, Benjamin Van Durme

  • KBPearl: un sistem de populatie de baza de cunostinte sustinut de legatura intre entitati si relatii “ – PVLDB 2020

    Xueling Lin, Haoyang Li, Hao Xin, Zijian Li, Lei Chen

Constructia bazei de cunostinte

  • „Rolul„ conditiei ”: un nou model de reprezentare si constructie a graficului cunostintelor stiintifice” – KDD 2019

    Tianwen Jiang, Tong Zhao, Bing Qin, Ting Liu, Nitesh V. Chawla, Meng Jiang

Entitati conexe

  • „Relationarea entitatilor juridice prin extragerea informatiilor deschise” – MTSR 2018

    Giovanni Siragusa, Rohan Nanda, Valeria De Paiva, Luigi Di Caro

OIE in diferite limbi

Majoritatea sistemelor OIE sunt axate pe extractii realizate din text scris in limba engleza. Cu toate acestea, unele sisteme OIE fie se concentreaza pe o alta limba decat engleza, fie sunt multilingve. In aceasta sectiune, sunt enumerate sistemele OIE in alte limbi decat engleza sau sistemele OIE multilingve.

Sisteme OIE multilingve

  • „Multi2OIE: Extragere multilingva de informatii deschise bazata pe atentia multi-cap cu BERT” (cod) – EMNLP 2020

    Youngbin Ro, Yukyung Lee, Pilsung Kang

  • „LOREM: Extragere de relatie deschisa compatibila cu limbajul din text nestructurat” (cod) – WWW 2020

    Tom Harting, Sepideh Mesbah, Christoph Lofi

  • Clasificator OpenIE explicabil cu reguli morfo-sintactice “ – HI4NLP @ ECAI 2020

    Bruno Cabral, Marlo Souza, Daniela Barreiro Claro

  • „Extragerea informatiilor deschise multilingve: provocari si oportunitati” – informatii 10 (7): 228, 2019

    Daniela Barreiro Claro, Marlo Souza, Clarissa Castella Xavier, Leandro Souza de Oliveira

  • „Extractia multilingva a relatiilor deschise folosind proiectia trans-linguala” – HLT-NAACL 2015

    Manaal Faruqui, Shankar Kumar

  • „MT / IE: Extragerea informatiilor deschise trans-lingvistice cu modele neuronale de secventa la secventa” – EACL 2017 (cod)

    Kevin Duh, Benjamin Van Durme, Sheng Zhang

  • „Extragerea informatiilor deschise multilingve” – EPIA 2015

    Pablo Gamallo, Marcos Garcia

Sisteme OIE pentru limba germana

  • „GerIE – Un sistem de extragere a informatiilor deschise pentru limba germana” – J. UCS 2018

    Akim Bassa, Mark Kroll, Roman Kern

  • „Portarea unui sistem deschis de extragere a informatiilor din engleza in germana” – EMNLP 2016 (cod)

    Tobias Falke, Gabriel Stanovsky, Iryna Gurevych, Ido Dagan

Sisteme OIE pentru limba portugheza

  • „Provocarile unei sarcini de adnotare pentru extragerea informatiilor deschise in portugheza” – PROPOR 2018

    Rafael Glauber, Leandro Souza de Oliveira, Cleiton Fernando Lima Sena, Daniela Barreiro Claro, Marlo Souza

  • „Abordare de inferenta pentru imbunatatirea extragerii de informatii deschise portugheze” – ICEIS 2017

    Cleiton Fernando Lima Sena, Rafael Glauber, Daniela Barreiro Claro

  • „DependentIE: Un sistem de extragere a informatiilor deschise in limba portugheza printr-o analiza a dependentei” – ENIAC 2017

    Leandro Souza de Oliveira, Rafael Glauber, Daniela Barreiro Claro

Sisteme OIE pentru limba spaniola

  • „Extragerea informatiilor deschise pentru limba spaniola pe baza constrangerilor sintactice” – ACL (Student Research Workshop) (2014)

    Alisa Zhila, Alexander Gelbukh

Sisteme OIE pentru limba chineza

  • „ZORE: Un sistem bazat pe sintaxa pentru extragerea relatiei deschise din China” – EMNLP 2014

    Likun Qiu, Yue Zhang

  • „Extragerea relatiei deschise chineze si stabilirea bazei de cunostinte” – ACM Trans. Lang asiatic si cu resurse reduse. Inf. Proces. 2018 (diapozitive, cod)

    Shengbin Jia, Shijia E, Maozhen Li, Yang Xiang

  • „Extractia relatiei deschise pentru frazele substantivelor chinezesti” – TKDE 2019

    Chengyu Wang, Xiaofeng He, Aoying Zhou

  • „Extractia relatiei deschise din China cu retele de generatoare de pointer” – DSC 2020

    Ziheng Cheng, Xu Wu, Xiaqing Xie, Jingchen Wu

  • „Retea neuronala cu grafic de dependenta multi- grained pentru extragerea informatiilor deschise din China” – PAKDD 2021

    Zhiheng Lyu, Kaijie Shi, Xin Li, Lei Hou, Juanzi Li, Binheng Song

Sisteme OIE pentru limba persana

  • „RePersian: Un instrument eficient de extragere a informatiilor deschise in persana” – ICWR 2020

    Raana Saheb-Nassagh, Majid Asgari, Behrouz Minaei-Bidgoli

  • „Un algoritm recursiv pentru extragerea informatiilor deschise din textele persane” – IJCAT 2018

    Mahmoud Rahat, Alireza Talebpour, Seyedamin Monemian

  • „Extragerea informatiilor deschise ca structura semantica intermediara pentru rezumarea textului persan” – Int. J. on Digital Libraries (2018)

    Mahmoud Rahat, Alireza Talebpour

  • „Parsa: Un sistem deschis de extragere a informatiilor pentru persan” – DSH 2018

    Mahmoud Rahat, Alireza Talebpour

Sisteme OIE pentru limba italiana

  • „Extragerea informatiilor deschise bazate pe lexic-gramatica din propozitiile in limbaj natural in limba italiana” – Sisteme si aplicatii expert 2019

    Raffaele Guarasci, Emanuele Damiano, Aniello Minutolo, Massimo Esposito, Giuseppe De Pietro

  • „Catre un set de date standard pentru extragerea informatiilor deschise in limba italiana” – SNAMS 2019

    Raffaele Guarasci, Emanuele Damiano, Aniello Minutolo, Massimo Esposito

Sisteme OIE pentru limba indoneziana

  • Extragerea informatiilor deschise indoneziene bazate pe reguli “ – ICAICTA 2018

    Ade Romadhony, Ayu Purwarianti, Dwi H. Widyantoro

OIE supravegheat

  • „Extragerea informatiilor deschise supravegheate” – NAACL-HLT 2018

    Gabriel Stanovsky, Julian Michael, Luke Zettlemoyer, Ido Dagan

  • „Extractia informatiilor deschise neuronale” – ACL 2018

    Lei Cui, Furu Wei, Ming Zhou

  • „Logician: O abordare neuronala end-to-end unificata pentru extragerea informatiilor in domeniu deschis” – WSDM 2018

    Mingming Sun, Xu Li, Xin Wang, Miao Fan, Yue Feng, Ping Li

  • „Logician si orator: invatarea din dualitatea dintre limba si cunostinte in domeniul deschis” – EMNLP 2018

    Mingming Sun, Xu Li, Ping Li

  • „Supravegherea modelelor de extractie a informatiilor deschise nesupravegheate” – EMNLP 2019

    Arpita Roy, Youngja Park, Taesung Lee si Shimei Pan

  • „Incorporari de cuvinte contextualizate intr-un model de extractie a informatiilor deschise neuronale” – NLDB 2019

    Injy Sarhan, Marco R. Spruit

  • „Achizitia de reguli pentru extragerea informatiilor deschise, supravegheata slab, bazata pe date” – CAIAC 2019

    Fabrizio Gotti E-mail, Philippe Langlais

  • „Invatarea extractiei informatiilor deschise a relatiilor implicite din citirea seturilor de date de intelegere” – CoRR 2019

    Jacob Beckerman, Theodore Christakis

  • „Model de extindere pentru extragerea informatiilor deschise pe corpus precis” (cod) – AAAI 2020

    Junlang Zhan, Hai Zhao

  • „Extragerea cunostintelor din textul web cu cautarea in arbore Monte Carlo” – WWW 2020

    Guiliang Liu, Xu Li, Jiakang Wang, Mingming Sun, Ping Li

  • Un algoritm avantaj-actor-critic cu explorare de incredere pentru extragerea informatiilor deschise “ – SDM 2020

    Guiliang Liu, Xu Li, Miningming Sun, Ping Li

  • „Model de etichetare neuronala hibrida pentru extractia relatiei deschise” – CoRR 2020 (date)

    Shengbin Jia, Yang Xiang

  • „IMoJIE: Extractie comuna de informatii deschise bazate pe memorie iterativa” (cod) – ACL 2020

    Keshav Kolluru, Samarth Aggarwal, Vipul Rathore, Mausam, Soumen Chakrabarti

  • „OpenIE6: Etichetarea retelei iterative si analiza coordonarii pentru extragerea informatiilor deschise” (cod) – EMNLP 2020

    Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Mausam, Soumen Chakrabarti

  • Comparatie sistematica a arhitecturilor neuronale si a abordarilor de instruire pentru extragerea informatiilor deschise – EMNLP 2020

    Patrick Hohenecker, Frank Mtumbuka, Vid Kocijan, Thomas Lukasiewicz

  • „Retea neuronala cu grafic de dependenta multi- grained pentru extragerea informatiilor deschise din China” – PAKDD 2021

    Zhiheng Lyu, Kaijie Shi, Xin Li, Lei Hou, Juanzi Li, Binheng Song

Canonicalizarea OIE

  • „Canonicalizarea bazelor de cunoastere deschise” – CIKM 2014

    Luis Galarraga, Geremy Heitz, Kevin Murphy, Fabian M. Suchanek

  • „CESI: Canonicalizarea bazelor de cunostinte deschise folosind incorporari si informatii laterale” – WWW 2018 (cod)

    Shikhar Vashishth, Printul Jain, Partha Talukdar

  • „Catre o canonizare a bazei de cunostinte deschise practice” – CIKM 2018

    Tien-Hsuan Wu, Zhiyong Wu, Ben Kao, Pengcheng Yin

  • „CaRe: Incorporari grafice de cunostinte deschise” – EMNLP 2019 (cod)

    Swapnil Gupta, Sreyash Kenkre, Partha Talukdar

  • „Canonicalizarea bazelor de cunoastere deschise cu informatii laterale din textul sursa” – ICDE 2019

    Xueling Lin, Lei Chen

  • „MULCE: Canonicalizare pe mai multe niveluri cu incorporari de baze de cunoastere deschise” – WISE 2020

    Tien-Hsuan Wu, Ben Kao, Zhiyong Wu, Xiyang Feng, Qianli Song, Cheng Chen

  • „Canonicalizarea bazelor de cunostinte deschise cu retea neuronala multi-stratificat cu grafice” – CoRR 2020

    Tianwen Jiang, Tong Zhao, Bing Qin, Ting Liu, Nitesh V. Chawla, Meng Jiang

Diapozitive

  • [pdf] „Extractie compacta de informatii deschise pe corpuri mari” . Discutie de Kiril Gashteovski sustinuta la NEC Labs Europe GmbH, 2019.
  • [pdf] „(Extragerea informatiei) Lectura 10 – IE ontologic si deschis” : O prelegere despre IE deschis, care face parte din cursul „Extragerea informatiilor”, de prof. dr. Alexander Fraser, de la LMU Munchen
  • Open IE Tutorial: Open Information Extraction for QA by Andre Freitas. Tutorialul a fost prezentat pe OKBQA 2018
  • [pdf] „Infiintarea bazei de cunostinte si extractia relatiei deschise chinezesti”, 2018
  • [pdf] „Scurta introducere si revizuirea sistemelor de extragere a informatiilor deschise (Open-IE)” . Prezentarea proiectului de Sina Miran.
  • [pdf] „Sisteme deschise de extractie a informatiilor si aplicatii din aval” de prof. Mausam. Discutia a fost prezentata la IJCAI 2016
  • [pptx] “Extragerea informatiilor deschise de pe web” , prezentat de prof. Oren Etzioni. Tutorialul a fost prezentat la AKBC-WEKEX 2012
  • [pdf] „ClausIE: Extragerea informatiilor deschise bazate pe clauze” de Luciano del Corro.
  • [pdf] „Extragerea informatiilor deschise: a doua generatie”
  • [pdf] „Extragerea informatiilor deschise: incotro mergem?” de Claudio Delli Bovi, 2016
  • [pdf] „O abordare informativa pentru evaluarea extractiei informatiilor deschise” de William Lechelle, 2016

Discutii

  • “Extragerea informatiilor deschise de pe web” , de prof. Oren Etzioni, prezentat la AKBC-WEKEX 2012. Slide: [pptx]
  • „Extragerea informatiilor deschise: incotro mergem?” , de Claudio Delli Bovi. Discutia a fost sustinuta la AI2 in 2016. Diapozitive [pdf]
  • „Propuneri imbricate in extragerea informatiilor deschise” de Nikita Bhutani la EMNLP 2016
  • „Crearea unui benchmark mare pentru extragerea informatiilor deschise” de Gabriel Stanovsky la EMNLP 2016
  • „OpenCeres: When Open Information Extraction Meets the Semi-Structured Web” de Colin Lockard la diapozitivele NAACL 2019 [pdf]

Cod

  • MinIE: Sistem de extragere a informatiilor deschise
    • MinIE: scris initial in Java
    • Impachetare Python pentru MinIE
    • MinScIE – un sistem de extragere a informatiilor deschise care ofera cunostinte structurate imbogatite cu informatii semantice despre citate (bazat pe MinIE).
    • SalIE – Extragerea informatiilor deschise saliente (bazata pe MinIE)
  • ClausIE: OIE bazat pe clauze
    • ClausIE: scris initial in Java
    • ClausIE (versiune mavenizata)
    • ClausIEpy: Infasurarea Python pentru ClausIE
  • OpenIE la IIT Delhi:
    • OpenIE6
    • IMoJIE: un sistem OpenIE bazat pe BERT
    • OpenIE5
  • OpenIE la UW:
    • OLLIE
    • ReVerb
  • OpenIE de la Stanford:
    • Stanford OpenIE: sistemul OpenIE de la Stanford.
    • Stanford OpenIE Spider: Extrageti informatii din WebCorpus folosind extragerea informatiilor deschise Stanford.
    • Infasurarea Python pentru Stanford OpenIE: Infasurarea neoficiala cu platforma Python pentru biblioteca de extragere a informatiilor de ultima generatie de la Universitatea Stanford.
  • Grafen: sistem OpenIE care contine rezolutia coreferentei, simplificarea si conducta de extractie a relatiei deschise
  • EXEMPLAR
  • DefIE: extragerea informatiilor deschise din definitiile textuale
  • ReMine: Integrarea coezivitatii locale si globale pentru extragerea informatiilor deschise
  • Sisteme OIE pentru alte limbi decat engleza sau sisteme trans-lingvistice:
    • Zhopenie – OIE chineza: sistem OIE pentru limba chineza scris in Python.
    • Extragerea relatiilor deschise pentru chineza: extragerea cunostintelor tripleaza (extractia entitatilor si a relatiilor) si construirea bazei de cunostinte bazata pe sintaxa dependentei pentru textul de domeniu deschis (pentru chineza )
    • Baaz: extragerea informatiilor deschise de pe web-ul persan (Python)
    • MT / IE: IE deschis in mai multe limbi. Model de secventa pe secventa bazat pe atentie pentru IE deschis in mai multe limbi. Scris in Python
    • Extractia relatiei pe site-urile germane: acest depozit contine o colectie de trei abordari de extragere a informatiilor deschise pentru limba germana
    • DptOIE: Un sistem portughez de extragere a informatiilor deschise bazat pe analiza dependentei
    • PragmaticOIE: o abordare bazata pe reguli pentru a extrage fapte in portugheza intr-un prim nivel pragmatic
  • MIEZ: Extractia relatiei deschise constiente de context cu masini de factorizare
  • CESI: Canonicalizarea bazelor de cunostinte deschise utilizand incorporari si informatii laterale
  • IMPLIE: IMPLIE (IMPLicit relation Information Extraction) este un program care extrage relatii binare din propozitii in limba engleza unde relatia dintre cele doua entitati nu este specificata in mod explicit in text.
  • Clasament: Iterative Rank-Aware Open IE (scor de incredere).

Date

Iesirea OIE este utilizata ca intrare utila in multe alte sarcini din aval, cum ar fi raspunsul la intrebari, inducerea schemei de evenimente sau generarea de reguli de inferenta. Mai mult, productia OIE poate fi utilizata ca „combustibil” pentru a obtine resurse suplimentare. Aici, datele sunt organizate in doua mari categorii: 1) corpuri OIE; 2) Resurse derivate din rezultatul OIE.

Corporatii OIE

  • OPIEC: An Open Information Extraction Corpus: cel mai mare corpus OIE de pana acum, continand peste 341M tripluri extrase din intreaga Wikipedia engleza. Fiecare triplu din corpus este compus din meta-date bogate: fiecare jeton din subj / obj / rel impreuna cu adnotari NLP (eticheta POS, eticheta NER, …), propozitie de provenienta impreuna cu analiza dependentei, original (auriu) ramas din Wikipedia, ordinea propozitiilor, spatiul / timpul etc.
  • [.gz] Extractii ReVerb: 15 milioane extractii OIE de inalta precizie (826 MB comprimate) din sistemul OIE ReVerb. Extractiile au fost facute din corpul ClueWeb09. Datele contin (subiect, relatie, obiect) triple, insotite de un scor de incredere (estimand probabilitatea daca triplul a fost corect extras) si informatii de provenienta (link-ul paginii web din care a fost extras triplul).
  • Extractii ReVerb (legate): 3 milioane de tripluri cu argument legat (un subset al extractiilor ReVerb de inalta precizie de 15 M). Link-urile (catre Freebase) sunt furnizate de un linker de entitati. Campurile de date sunt: argumentul 1, fraza de relatie, argumentul 2, ID-ul bazei libere pentru legatura argumentului 1, numele entitatii bazei libere corespunzatoare, scorul legaturii, scorul ambiguitatii legaturii
  • PATTY: PATTY este un sistem care ia relatii deschise intre doua argumente, le structureaza in synseturi relationale si apoi le organizeaza intr-o taxonomie. Aceasta resursa contine peste 15 milioane de tripluri cu argumente dezambiguizate (linkuri catre articole WikiPedia) si ID synset de relatie intre ele. In plus, resursa contine: 1) synsets de tipare de relatie cu semnaturi de tip; 2) subsumtiile modelului de relatie; 3) parafrazele relatiei; 4) date de evaluare;
  • WiseNet (1.0 si 2.0): in mod similar cu PATTY, WiseNet 1.0 / 2.0 este o sursa care contine tripluri OIE, unde argumentele sunt dezambiguizate si relatiile deschise sunt organizate in seturi de relatii si apoi taxonomizate. Una dintre principalele diferente dintre PATTY si WiseNet este ca WiseNet contine „verigi de aur” pentru argumente (adnotate de oameni) prin pastrarea legaturilor originale din articolele WikiPedia.
  • KB-Unify: KB-Unify ia ca intrare mai multe corpuri OIE si le unifica intr-un singur depozit OIE dezambiguizat. Relatiile deschise sunt organizate in seturi de relatii si argumentele sunt dezambiguate cu BabelFy.

Resurse derivate din rezultatul OIE

  • Relatii functionale: 10K Relatii functionale. Aceasta resursa provine din lucrarea “Identificarea relatiilor functionale in textul web” , publicata pe EMNLP 2010.
  • Reguli de reducere: 10M reguli de implicare predicative invatate folosind algoritmi locali si globali. Din documentatie: „Aceasta resursa de reguli de implicare predicativa contine trei resurse in doua formate – superficial si sintactic. Resursele sunt invatate prin setul de date REVERB si folosind localul si algoritmii descrisi in capitolul 5 al tezei lui Jonathan Berant (care face parte din pachet).”
  • Reguli de restrictionare: 36K reguli de conectare de inalta precizie (date si cod). Resursa este rezultatul muncii lui Prachi Jain si Mausam „Rescrieri lingvistice ghidate de cunoastere pentru verificarea regulilor de inferenta” publicate pe NAACL-HLT, 2016.

Teze de doctorat

  • „Constructing Lexicons of Relational Phrases” de Adam Grycner, Universitatea din Saarland, Germania, 2017

  • „Metode pentru extragerea informatiilor deschise si dezambiguizarea sensului asupra textului in limbaj natural” de Luciano Del Corro, Universitatea din Saarland, Germania, 2016

  • „Extensie automatizata a bazei de cunostinte folosind informatii deschise” de Arnab Kumar Dutta, Universitatea din Mannheim, Germania, 2015

  • „Exploatarea cunostintelor in extragerea informatiilor deschise nesupravegheate” de Yuval Merhav, Illinois Institute of Technology, SUA, 2012

  • „Extragerea informatiilor deschise pentru web” de Michele Banko, Universitatea din Washington, SUA, 2009

Demonstratii

  • ClausIE: Demo pentru ClausIE, un sistem OIE.
  • Regasirea faptelor: regasirea faptelor cu OpenIE pe corpuri mari.