NEWSニュース

文章類似度判定装置などの特許を取得 - 文章の盗用、剽窃を精度高く検知

  • 2023.5.16
    プレスリリース

独自の自然言語処理テクノロジーと50万人超のライターネットワークを抱え、コンテンツマーケティングを支援する”EDITECH(EDIT+TECHNOLOGY)”カンパニーのCROCO株式会社(本社:東京都渋谷区、代表取締役:栗田佳典)は、文章同士の類似性を数値によって算出し、類似度を判定するシステムに関する特許を取得いたしました。

【特許情報の概要】
特許番号 :特許第7138981号
発明の名称:類似度判定装置、類似度判定システム、類似度判定方法、およびプログラム
登録日   :2022年(令和4年)9月9日

技術開発の背景

当社はコンテンツマーケティングに関わる様々なソリューション・製品を提供しており、独自の自然言語処理技術による業務の効率化、特に文章の「校正」「類似判定」「要約」「生成」「テキストマイニング」などの人力では時間がかかる業務やタスクの課題を解決してまいりました。

中でも、コンテンツマーケティングの一環としてオウンドメディアを運営している企業にとって、公開している記事コンテンツが無断転載や盗用、剽窃などの被害に遭っていないかを調査することは重要な業務です。

当社が提供しているSaaSの「chiyo-co(ちよこ)」では、無断転載・引用をチェックする従来のコピペチェック(文字列の一致を判定)機能に加え、「文章の類似性(文章同士がどれだけ似通っているか)」を数値で算出し、類似度として判定する機能を組み込むことで、より高精度な調査を可能としました。

技術の特徴

本特許は、解析元の文章(第1文章)と比較対象の文章(第2文章)のそれぞれを分解した文ごとの特徴ベクトル(文ベクトル)を取得し、それぞれの文章に含まれる重要な要素(キーフレーズ)を取得する装置を備えています。さらに、これらの文ベクトル同士の類似度と、同じキーフレーズの出現度合の類似度に基づいて、第1文章と第2文章の総合類似度を算出する機能を持っています。これらの数値で表された類似度をグラフやレーダーチャートなどのUI(ユーザーインターフェース)で表示することにより、わかりやすく直感的にテキストコンテンツをチェックすることが可能になります。

AI(人工知能)による文章生成サービスが急速に普及していますが、こういったサービスを利用する中で、既存の著作物と同一あるいは類似している文章を生成してしまい、それらを利用することで意図せず著作権を侵害してしまうおそれがあります(※)。本特許の類似度判定システムは、こういった意図しない著作権侵害を防ぐためにも有効です。

※一般社団法人日本ディープラーニング協会が2023年5月1日に、AIを使用したコンテンツの生成・利用についてのガイドラインを発表しました。これによると『(AIによる)生成物を「利用」(配信・公開等)する場合には、生成物が既存著作物に類似しないかの調査を行うようにしてください。』とあります。
出典:資料室 - 一般社団法人日本ディープラーニング協会【公式】 
「生成AIの利用ガイドライン( https://www.jdla.org/document/#ai-guideline )」

今後の展望

当社が提供する「chiyo-co(ちよこ)」の機能をAPI(Application Programming Interface)として提供し、より多くの方に著作権侵害リスクの対策を行っていただけるよう、現在開発を進めております。

本件に関するお問い合わせ先

お問い合わせは当社お問い合わせフォームからご連絡ください。
https://cro-co.co.jp/contact/
 

SEMINARセミナー情報

...loading

導入のご相談・お見積もり
お問い合わせはお気軽にどうぞ

当社サービスについて

当社サービスについて

資料ダウンロード

資料ダウンロード

お電話でのお問い合わせ

お電話でのお問い合わせ

03-4405-9236

平日10:00〜19:00