蔵ログ

没頭できることを求めて

東大松尾研発の要約AI「ELYZA DIGEST」で名作文学を要約してみる

東大松尾豊研究室発のベンチャー企業が、またすごいものを発表しました。

文章の要約文を生成するAI、その名も「ELYZA DIGEST」

www.digest.elyza.ai

すごいのは、テキスト要約だけではなく、URLを入れるだけで3行に記事を要約してくれるサービスです。

現在は本格的なサービス前のデモサイトですが、実用化されれば様々な場面での利用が考えられまます。

今回は、このサービスを利用して、名作文学を要約してみたいと思います。

 

 

東大松尾研究所とは

今回の「ELYZA DIGEST」はELYZAという会社のサービスですが、ELYZAは東大松尾研発のAIベンチャーと言われています。

東大松尾研は日本のディープラーニングの第一人者、松尾豊教授の研究室です。

2015年に発売された著書「人工知能は人間を超えるか」がベストセラーとなり、私もその時存在を知りました。

その後は後進育成に精力的に取り組まれている様子で、卒業生がどんどん起業しているみたいです。

 

わかったこと

一通りやってみてわかったのは、わかったのは

 

  • 新仮名と旧仮名
  • URLとテキスト入力 

で結果が変わります。また、

  • 小説は向かない
  • まだまだこれからのサービス

だなと思いました。

 

新仮名と旧仮名

明治大正文学は旧仮名遣いのバージョンもあり、両方試した結果、新仮名の方がより正確だった気がします。

 

URLとテキスト入力 

URLをコピペするだけでも3行要約を作ってくれますが、余計な情報が入るぶん精度が落ちる気がしました。

時間があれば、必要箇所のみをコピペした方が良さそうです。

 

小説には向かない

趣旨と土台からひっくり返しますが、小説はそもそも要約するものでありません

要約は大事な情報だけを抜き取る行為なので、内容や読む行為そのものに意味がある小説を、情報として抜き取ることお価値は低そうです。

そもそも小説を3行で要約すること自体が難しく、小概要が知りたければあらすじを読めば事足ります。

 

まだまだこれからのサービス

ということで、これから小説の要約結果とコメントをしていきます。淡々と思ったことを書いていくので、やや上から目線の印象もあるかもしれません。その点ご了承ください。

繰り返しになりますが「ELYZA DIGEST」の今後にはめちゃめちゃ期待しています。

これからも進化し続けると思いますが、陰ながら応援させていただきます。


芥川龍之介

羅生門

芥川龍之介が、京都の「下人」の心情を語っている。下人は、雨やみをする市女笠や揉烏帽子を、見回りながら見まわっていた。雨にふりこめられた下人は、行き所がなくて途方にくれていたと推測した。

最後の「推測した」は違和感ありですが、それ以外はいい感じです。老婆などが出てこないので、全体の要約というより、イントロに近い印象です。 

 

蜘蛛の糸 

芥川龍之介が、極楽の蓮池のふちを独りでぶらぶら御歩きになっていた。蓮の葉の上に、極楽の蜘蛛が一匹美しい銀色の糸をかけていた。蜘蛛の糸を掴みながら、一生懸命に上へ上へとたぐりのぼり始めた。

ぶらぶら歩いていたのはお釈迦様ですが、そこに目をつぶれば内容的には悪くありません。

蜘蛛の糸を〜」の前にカンダダの名前が入れば完璧です。

 

 

夏目漱石

こころ

夏目漱石が、西洋人を見つめる理由を考察している。西洋人は、日本人に「何言(ふたこと)かいった」と声をかけたという。日本人は、砂の上に落ちた手拭(てぬぐい)を拾い上げているところだった。

そんな話だったか...?

 

太宰治

走れメロス

走れメロスが、邪智暴虐の王を除かなければならぬと決意した。王は、メロスの無二の友人を人質として殺害し、三日目に殺害した。王は、メロスの罪を永遠にゆるしてやろうと、激怒した。

王はセリヌンティウスを殺害して、激怒した。原文とは異なった結果になっている。これはこれで面白い展開。

 

人間失格

はしがきが、人間失格の青年の写真を3つ紹介している。幼年時代、猿の笑顔は、顔に醜い皺を寄せているだけである。その顔には表情が無いばかりか、印象さえ無い。

人間失格のドキッとなる冒頭を要約してくれた感じ。

 

福沢諭吉

学問のすすめ

福沢諭吉が、学問のすすめについて解説している。人は生まれながらにして貴賤・貧富の別なし、学問をするには分限を知ること肝要。人の天然生まれつきは縛られず、一人前の女は女にて自由自在なれども放蕩(ほうとう)に陥る。

そこじゃない気もするが言っていることは本文と合致している。後半は少し注が必要で、原文の前提の部分が抜けている。

一人前の女は女にて、自由自在なるものなれども、だだ自由自在とのみ唱へて分限を知らざれば、わがまま放蕩に陥ること多し。すなはちその分限とは、天の道理に基づき人の情けに従ひ、他人の妨げをなさずしてわが一身の自由を達することなり。

 

中島敦

山月記

中国で、詩人として知られる李徴が、旅先での苦悩を語っている。旅先での苦悩を、李徴は「何事も我々には判らない」と語った。李徴は、旅先での苦悩を、自らの手で悟り、自らの手で死に至ったという。

李徴がいっぱい出てくる。代名詞となる「臆病な自尊心」と「尊大な羞恥心」は出てこない。

 

坂口安吾

堕落論

坂口安吾氏が、天皇制に就いても独創的な政治的作品を見るべきだと主張している。天皇制は、天皇によって生みだされたものではないと指摘。天皇制は、政治的理由によってその存立を認められてきたと述べている。

そもそも堕落論自体が解釈の難しい作品で、読んだ人の数だけ読み方のありそうな内容である。が、なかなかどうして悪くない要約。

堕落論の本質的な部分ではないにしろ、その理論を支える天皇制についてズバリ指摘した文章。

今回要約した中で、1番の良い要約かもしれない。


森鴎外

舞姫

森鴎外は、旅の憂さを慰めるために「旅の苦」を苦むという。旅の苦は、詩に詠じ歌によめる後は心地すが、詩に詠じ歌によめる後は心地すが。旅の苦は、心の奥に凝り固まり、一点の陰とのみなり、と筆者。

エリスが出てこず。原作を知らないと旅行文学かな?と思うような内容。

 

 

番外編:このブログの記事

最後にこのブログの記事を要約してみたいと思います。

今日たまたま上位に来ている3つを要約してみます。

 

マクドナルドハワイアンバーガーのカロリーと実食レビュー - 蔵ログ

マクドナルドのハワイアンバーガーを実食レビューしている。チーズロコモコは、レギュラーのハンバーガーと比べてかなり味が濃い。ガーリックシュリンプは、辛味のあるソースが使われているのが特徴。

確かにそんなことを書いた。素晴らしい要約。

 

元全国2位が教える【受験日本史】~其之壱~「 日本史の年号暗記はしなくてよい」 - 蔵ログ

歴史の年号を暗記するコツを解説している。主語、動詞、目的語、補語を全て覚える、起こった順番は聞かれる。年号を覚えるより何時代を覚える方が大事、上2桁はほぼ自動で決まる。

確かにそれも書いた。素晴らしい要約。 

 

英語の勉強法【初級編:偏差値35~50】 - 蔵ログ

偏差値35〜45の受験生向けに、偏差値50にする勉強法を紹介している。単語は英語を読む上で必須で、2000語ほど掲載されている単語帳がオススメ。単語は覚え方や雑学が100字程度で書かれているため、挫折する可能性がある。

初学者向けには、2000語の単語帳はススメていない(言及はしているけど)。 文字数に制限があるので仕方がないが、単語のみに触れて、文法や解釈には触れられていない。

 

最後に

新しい技術のおかげで、非常に面白い試みができました。

気になる名作文学があれば要約してみますので、ぜひコメントかDMを送ってください。

お待ちしております。