Google+より投稿

good read: "長文をあっさり短く。テキスト要約エンジン「TextTeaser」" http://feedly.com/k/1eKdu9x

=======================================
good read: "長文をあっさり短く。テキスト要約エンジン「TextTeaser」" http://feedly.com/k/1eKdu9x



TextTeaserはScala製のオープンソース・ソフトウェア(MIT License)です。Webサイトの基本はテキストです。しかし長文を読み続けている余裕は現代人にはありません。そこで使ってみたいのがTextTeaser、テキストサマライズエンジンです。一例。文書が段落ごとにまとまって表示されました。日本語だとうまくいかないかも知れません…。TextTeaserは要約エンジンであり、大事な部分のテキストだけをピックアップして表示してくれます。ブックマークレットも提供されており、任意のURLに対して要約処理が実行できます。肝になるのはそのアルゴリズムになるでしょう。“重要な部分”をいかにピックアップするかがTextTeaserの価値になります。最近はこういった大事な部分、URLだけをピックアップする技術に人気が集まっています。インターネットでは膨大な情報が溢れているため、それを全て処理するには時間が足りないのが実情です。それだけにスパムではない、無用な情報をフィルタリングしたり逆に重...





https://plus.google.com/106218564410864892476

October 24, 2013 at 07:39AM

コメント

このブログの人気の投稿

投稿時間:2021-06-17 05:05:34 RSSフィード2021-06-17 05:00 分まとめ(1274件)

投稿時間:2021-06-20 02:06:12 RSSフィード2021-06-20 02:00 分まとめ(3871件)

投稿時間:2020-12-01 09:41:49 RSSフィード2020-12-01 09:00 分まとめ(69件)