衣服の種類を判定する学習モデルについて
衣服の図面画像を読み込ませるとその種類を返すシステムを作成した。 学習モデルについて 画像から輪郭だけを抽出した輪郭画像と、オリジナル画像の2つを入力データにすることにした。 例えばTシャツならTの字になっているし、スカ […]
Filter by Category
衣服の図面画像を読み込ませるとその種類を返すシステムを作成した。 学習モデルについて 画像から輪郭だけを抽出した輪郭画像と、オリジナル画像の2つを入力データにすることにした。 例えばTシャツならTの字になっているし、スカ […]
今回、画像分類で精度を高めるために複数データの入力できる学習モデルを作成した。その経緯から始めて実際のモデリングまでを書くことにする。 前提 今回は洋服の図面を読み込み、それがなんの種類かを判別するCNNを作成した。 図 […]
衣服の図面画像を読み込ませるとその種類を返すシステムを作成した。
画像から輪郭だけを抽出した輪郭画像と、オリジナル画像の2つを入力データにすることにした。
例えばTシャツならTの字になっているし、スカートなら台形になっている。 このように、衣服の種類はその輪郭である程度判定できるであろうと考えた結果、輪郭写真も入力データとして使うことを決めた。
この2枚の画像によって衣服の種類を判定させようというのが今回作成したモデルである。 実装はpytorchで行った。
各画像をCNNに入力し、特徴量を1000個抽出する。 合計2000個の特徴量をNNにより更に学習させて、最終的に9個のパラメータにする。
事前に0番目をスカート、1番目をシャツ等と割り振りさせておいて、9個の数値のうち、最も数値が高い番号を予測結果とする。 最後に予測番号を割り振った名称に置き換えて結果として返す。 CNNの部分に関してはResNet50という技術を用いるなどの工夫をした。
まず、図面画像を.pngや.jpegからコンピュータが計算しやすいtensor形式に変換して、画像の大きさを揃える必要がある。 その上で、学習モデルに入れるために輪郭だけ抽出するなどの処理も作成した。
群馬県でPythonを使ったAIやソフトウェアを開発している株式会社ファントムが運営しています。
メーリングリストに登録するとファントムの最新情報をお届けします
お客様のメールアドレスを共有することはありません