あさっての基幹産業

日本の基幹産業の技術に関して考える

時系列のデータから機械学習の正解データを作る方法

Tesla社の特許

WO2020159960A1:Generating ground truth for machine learning from time series elements

 

ニーズ

 自動運転などのアプリケーションに使用される深層学習システムは、機械学習モデルをトレーニングすることによって開発されます。通常、深層学習システムのパフォーマンスは、モデルのトレーニングに使用されるトレーニングセットの品質によって少なくとも部分的に制限されます。

多くの場合、トレーニングデータの収集、キュレーション、および注釈付けに多大なリソースが投資されています。

 

現状

 従来、トレーニングデータセットをキュレートするための作業の多くは、潜在的なトレーニングデータを確認し、データに関連付けられた機能に適切にラベルを付けることによって手動で行われます。

正確なラベルを使用してトレーニングセットを作成するために必要な労力は多大なものになる可能性があり、多くの場合面倒です。

さらに、機械学習モデルの改善が必要なデータを収集して正確にラベル付けすることは、多くの場合困難です。

解決方法

 レーニングデータセットは、非常に正確な機械学習結果を生成するための機械学習モデルをトレーニングするために使用されます。いくつかの実施形態では、キャプチャされたデータの時系列を使用して、トレーニングデータを生成する。

訓練データは、人間によるラベル付けなしで自動的に作成される。レーニングデータを使用して、機械学習モデルをトレーニングし、画像データ500などのキャプチャされた画像データから車線の3次元軌道を予測することができる。

f:id:dopodomani7:20210714154149p:plain

f:id:dopodomani7:20210714154257p:plain

WO2020159960A1