今、自然言語処理ツールの強力なパッケージを使って、テキストの情報と意味をキャプチャできるスパゲティ状のネットワークを構築できるようになりました。そうしたさまざまな言語理論がごちゃ混ぜになったインスタンシエーションの中には、自然言語の本質を捉える、相互に複雑につながり合った構造が大量に存在します。すべてがつながっているとはいえ、どのつながりが重要で、何のためにつながっているのでしょう?私の研究では、そうしたインスタンシエーションの中から、構造生成に関する問題を解決するために有益で、特定の言語理論や問題領域にとらわれない解決方法を自動的に抽出する方法を探っています。私は特に、現在の最先端技術が到達していないものの、豊かな表現が不可欠だと感じられるものについて、全体として意味的な一貫性を持つテキストを生成することに興味を持っています。
[Keywords]
自然言語処理 / 構造生成 / 豊かな表現
Today, powerful suites of natural language processing tools can be used to construct rich, spaghetti-like networks capturing the knowledge and semantics of text. Somewhere among these hotchpotch instantiations of various linguistic theories is a wealth of elaborate interconnected structures that capture something fundamental about natural language. Everything is connected, but which connections are important and for what? In my research, I explore how to automatically extract what is useful from such representations towards solving structure generation problems while attempting to find solutions that are agnostic to particular linguistic theories or problem domains. I am particularly interested in the problem of generating globally semantically coherent text, as this seems to be what is currently out of reach from the current state of the art and where I feel rich representations are crucial.
[Keywords]
Natural language processing / Structure generation / Rich representations