一般社団法人E'GA

語学Lab E'GA       

 

 


                                                                                                http://e-ga.jp

  
 
 E’GA研究室では現在中日・日中対訳文をデータ化(Excelに入力)する作業を行っております。
 
 当研究室の専門分野は日中同形語ですが、その中でも特に「同義」とされてきた同形語(「所謂同形同義」)を研究対象としております。言語使用の中で同じ意味だと思われがちな同形語には実は、微妙なズレが潜んでいるケースが多く、当研究室では主にこのような主観では判断が難しい微妙なズレ:「グレーゾーン現象」に注目しております。
 
 プロの翻訳者が訳した文面と、人工知能(機械)で翻訳された文面、どちらも(特に同形類義)起点言語の影響をそのまま受ける傾向が見られます。翻訳者による翻訳及び機械翻訳の「精度」を上げるには、このグレーゾーン現象がカギとなるのではないでしょうか。
 
 何か不明確になっている事柄や謎を世間一般に流されることなく、確かなる根拠を集め、考察を重ねていく過程はとても楽しいことです。糸口を掴んだ時は実に達成感を感じたりします。
 
 女性として、家庭と仕事の両立はいろいろ大変ですが、疑問になっている「何か」を明らかにすることはわたくしの趣味ですし、遣り甲斐のあることだと信じております。何かを極める道のりは困難が付きもので、うまく進まないことの方が多いかもしれません。でも、周囲への忖度なく、自分が目指すことはとことん続けていこうと思います。
 
 では、本題に入りますが、近年『文章を科学する』(李在鎬編2017)という表現を私はとても気に入っております。「文章を科学する」ためには、謎を解く準備段階及び手順をしっかり整えることが大事です。即ち、言語資源を確保し、それに基づいた計量的分析を「正確に」行うということです。「意味の記述は、現象における量的なちがいを説明できなければ、不完全である」(宮島達夫1986;57)との教えをモットーに、自負を持って挑みたいと思います。
 
 これまでの日中対訳コーパスは、高度なシステム構築(アライメントなど)が要求されていましたが、近年はExcelに入力したシンプルなデザインが却って役に立つ場合もあります(テキストマイニング―KH coderなどの導入の場合)。残念ながら現在、利用できる既存の対訳コーパスは限られ、扱われているデータは50年前の作品がベースになっております。特に、中国語が起点言語になっている文章はジャンルに偏りがあり、現代の言語使用全般を代表できるようなデータとは言えません。適切な言語資源がデータとして利用できなければ「文章を科学する」のは到底無理な話です。
 
 「この世にないものは自分で作るしかない!」E'GAでは、近年対訳文のデータ化作業をスタッフ総動員で進めております。
 
 本プロジェクトは近い将来、多くの研究者に公開できる「日中対訳コーパス」の構築を目指しております。
 
 言語研究における多言語資源の充実化に向けて、今後の進展を見守っていただければ幸いです。同時に、2024年4月以降より日中対訳コーパスを用いた共同研究を募集しております。
 
 共同研究を希望される方はお問合せください。

                                         語学Lab E'GA
e-Rad研究機関名:一般社団法人E’GA
研究者番号:90985524
researchmap

 

 

 
 
 
 
E'GA
LINE公式アカウント
友だち追加

E'GA書店
 
 
 

アクセス
〒541-0054 
大阪市中央区南本町1丁目3–9
サンコービル2F 203

TEL:
06-6484-6621
 

 

地下鉄中央線、堺筋線 
堺筋本町駅 1番出口より
徒歩1分

地下鉄谷町線
谷町4町目駅6番出口より
徒歩7分