wikipediaでしりとり

ぶたさんの辞書は20万語でしりとりをして楽しいことのもう一つの理由は、固有名詞、普通名詞が両方入っているというのがあると思う。そんな意味では20万語あってもどんどん陳腐化しているので、たとえばということでWikipediaを思いつきました。現在47万語。ウィキペディアは前は言語別にアイテム数とか書いてあったのですが、さっき見に行ったらそれぞれのページに行かないとわからない。ま、競争してもしょうがないのでいいですが。Englishは2百万。中国語(中文)は16万かな。

ダウンロードはできるようなので、一度downloadしてみようと思います。おもいつくところでは、まずひらかな化、拗音促音の処理、スペースや中黒等がどうなっているか。ぶたさんとの重複等について。

追記形式で進捗を書きますのでお楽しみ。