ハクチョウノミズウミ

雑多なごった煮。

立花理香のブログのタイトルの「ボカロ曲感」率を算出する

はじめに

このネタを思いついた時に内容が技術2割ネタ8割になるだろうと察し、はてなブログに書くか Qiita に書くか悩んだのですが、最終的に

  • コードを除いた全体の内容をはてなブログ
  • コード等技術っぽいものだけを Qiita で

書くことにしました。
なので手法が気になる物好きな方は

qiita.com

もご覧ください。

立花理香さんって

かわいいですよね。京都女子大学大学院博士課程満期退学(と一説には言われている)という才女だし、関西ローカルでモデルとかリポーターやってただけあってスタイル抜群だし、あとビール好きだし。小早川紗枝ちゃんも好き。
でもそんなパーフェクトなりっかさまの、どうしても好きになれないところが一点だけあるんですよ。

それが、ブログのタイトル

ameblo.jp

とりあえず2月12日の朝時点での最新10件分のタイトルをご確認ください。

均衡クレマリー
爪先ジャガー
くぐもりセレクション
雪庇プラズマティックス
三椏ドーリィ
ボックス砂おろし
点滴スウィープ
郭公イニシアティブ
手押しマーガレット
ひろうすニュートラ

なんだこのボカロ曲感は。
しかもこのタイトル、内容に全く関係がない。なーーーーんにもない。

ぼくがボカロ曲に情熱を注いでいた頃の末期はじん氏(自然の敵P)のいわゆる「カゲロウプロジェクト」が大人気で、楽曲はキャッチーで中高生に大ウケ、小説化され漫画化され挙句の果てには1クールアニメにもなった。そして熱狂したファンがあちこちで問題を起こし、動画は荒れ悪行は連鎖し続けていった。
そんなじん氏の楽曲は処女作「人造エネミー」を始め、「想像フォレスト」、「夜咄ディセイブ」と、

漢字2文字 + カタカナ

という形式のタイトルが何曲かあった。
そのせいか、そんな感じの日本語を見ると、黒歴史と嫌悪感が混ざって謎の感情を引き起こし、結果として表情筋を引きつらせるのに十分な力を発揮するのであって……。  

 

などというラノベ主人公的な自分語りはほどほどにして。
ともかく、立花理香さんの書くブログのタイトルは「漢字orひらがなワンワード + カタカナワンワード」の割合がめちゃくちゃ高い(ように感じる)。気になったので、実際どのくらいの割合でこんなタイトルなのか調べてみることにしました。

やり方

はだいたい Qiita に書いたのでそっちを参照してください。

判定条件は

  • 厳密に「漢字2文字 + カタカナワンワード」のものだけを数える
    広義にすると相当数引っかかりそうだったのと、コードの書きやすさ的にも。
  • 分析対象は2月12日10時時点の最新記事から1000件分

としました。

結果

1000件分貼ると怒られそうなので Gist に置いておきました。同期処理をかけているので並び順は最新順ではありません。

というわけで

ボカロ曲っぽいタイトル: 241
っぽくないタイトル: 759

割合: 24.1%

となりました。多い……のか?

まとめ

  • 意味のないタイトルはともかく形態素解析がミスるような難解な語句はやめてくれると嬉しいです
  • この流れで「ご報告」「お知らせ」とか書かれたら死ぬ
  • もっと膨らませたら声優統計に寄稿できたかもれないのにもう新刊でないなんて……