Eyes, JAPAN Blog > 統一性のなさ

統一性のなさ

nihei

この記事は1年以上前に書かれたもので、内容が古い可能性がありますのでご注意ください。

最近、「本の情報を引っ張ってこれるAPIを使って、うまく書庫管理でもできたらな~」と考えていました。
実際に簡単なシステム作ってみようと作業を進めていると思わぬ障害が。
その障害というのは、書籍情報の統一性のなさです。

当初使用しようとしていたAPIが二つありまして、RAKUTEN WEBSERVICEとAmazonのProduct Advertising APIというものです。せっかく書籍管理をするのでシリーズで管理はしたかったのですが、APIから引っ張ってこれる情報では容易ではありません。amazonで実際に検索して出てくる情報がほとんどそのままAPIで引っ張ってこれるので実際に検索してもらえばわかるとは思いますが、巻情報の表現が非常に多いのです。

下記は一例ですが
本(1)
本 2
本 3巻
本 4巻

数字にまで全角と半角を織り交ぜてあるケースも多々。

更には本の新装版もあり

本 完全版 1
本 限定版 18

等々。。。。。
ここにあるだけでも愕然としたくなるのですが、これでもまだ一例です。

Amazonだけが酷いのかと思い(願い)楽天の方のAPIも確認しましたが、どちらも似たり寄ったりでした。一時の希望を与えてくれたのが楽天のAPIの方では読み仮名情報です。これを使えばいける!と
思ったのも束の間、なんとカナで入っているはずのデータに漢字が入っているケースが。。。これは、データ入力を人力手作業でやっている為だと思われます。

現在、何とか管理できまいかと模索してしていますがこのプロジェクトは盛大に頓挫しかけています。
何か画期的な管理アイディアを是非お待ちしております。。。

  • このエントリーをはてなブックマークに追加

Comments are closed.