Genderize.ioを使って性別判定してみる
以前、顔写真を使って性別判定についての検証をした。
顔写真による性別判定はそこそこ判定が高くすごく満足しているのだが、顔がない場合の判定はどうすればいいんだろうと思い、ちょい調べてみた。
名前による判定
Genderize.ioと呼ばれる、名前による男女の判定はすでに存在していた。
自分たちでもできそうな気もしなくもないけど。。。とりあえず使ってみる。
デモでapi
が使えるため、実際に自分の名前出たていてみると
curl https://api.genderize.io/?name=kazuki
{"name":"kazuki","gender":"male","probability":1,"count":16}
json
でデータがかえってくるため、各項目の意味を調べると以下になる。
name: 入力した名前 gender: 性別 probability: 確からしさ(精度) count: ヒットしたデータ数
公式には、probability
とcount
を使って自分たちで閾値みたいなのを決めてねと書いてある。
今回だとprobability
は1なのでほぼあってそうに見えるけど、count
が少ないため少し怪しいのかなーと思う。kazuki
でも女性の名前はいるので、日本語は少し弱いのかな?という印象を受ける。
終わりに
いくつか名前の検証をした感じだと良さそう。本番である程度試したらまた検証記事書こうと思う。