特許
J-GLOBAL ID:201703016633233995
道路シーンのセマンティックセグメンテーションのための制約付きデコンボリューションネットワークのトレーニング
発明者:
,
,
出願人/特許権者:
代理人 (6件):
蔵田 昌俊
, 野河 信久
, 峰 隆司
, 河野 直樹
, 井上 正
, 鵜飼 健
公報種別:公開公報
出願番号(国際出願番号):特願2017-029703
公開番号(公開出願番号):特開2017-162456
出願日: 2017年02月21日
公開日(公表日): 2017年09月14日
要約:
【課題】入力画像の対応するエリアのラベルデータを作るためのトレーニングされたコンピュータシステムを提供する。【解決手段】ソースデコンボリューションネットワークが、セマンティックセグメンテーションを実行するために、適応的にトレーニングされる。次いで、画像データが、ソースデコンボリューションネットワーク(S-Net)に入力され、S-Netの出力が測定される。同じ画像データおよびソースデコンボリューションネットワークの測定された出力は、ターゲットデコンボリューションネットワークをトレーニングするために使用される。ターゲットデコンボリューションネットワークは、ソースデコンボリューションネットワークより実質的に少数の数値パラメータによって定義される。【選択図】図8
請求項(抜粋):
入力画像の対応するエリアのラベルデータを作るためのコンピュータシステムを形成するためのコンピュータ実装方法であって、前記ラベルデータは、所定の値のセットのうちの1つの所定の値であり、前記画像の前記対応するエリアがオブジェクトカテゴリのセットのうちのそれぞれのオブジェクトカテゴリ内にあるオブジェクトの画像であることを示し、前記方法は、
(i)トレーニング画像を符号化する第1の画像データおよび(ii)各トレーニング画像の注釈データの対応するセットを備えるトレーニングデータを使用する監視された学習によって、複数の第1の値によって定義されるソースデコンボリューションネットワークを適応的に生成することと、各トレーニング画像の注釈データの前記セットは、前記トレーニング画像の複数の対応するエリアについて、前記トレーニング画像の前記エリアが、オブジェクトカテゴリの前記セットのうちのそれぞれのオブジェクトカテゴリ内にあるオブジェクトの画像であることを示し、
前記ソースデコンボリューションネットワークにトレーニング画像を符号化する第2の画像データを入力し、前記ソースデコンボリューションネットワークの1つまたは複数の出力を記述する対応する出力データを収集することと、
複数の第2の値によって定義されるターゲットデコンボリューションネットワークを適応的に生成するために、前記第2の画像データおよび前記出力データを使用することと、前記複数の第2の値のカーディナリティは、前記複数の第1の値のカーディナリティより低く、
前記ターゲットデコンボリューションネットワークを実装するコンピュータシステムを形成することと、
を備える、コンピュータ実装方法。
IPC (3件):
G06T 7/00
, G06N 3/08
, G06N 3/04
FI (3件):
G06T7/00 350C
, G06N3/08
, G06N3/04
Fターム (7件):
5L096EA39
, 5L096GA30
, 5L096GA34
, 5L096HA09
, 5L096HA11
, 5L096JA22
, 5L096KA04
前のページに戻る