2022-01-01から1年間の記事一覧

ONNXRuntimeのカスタムオペレータを実装してみた

ソースコードはここ↓ github.com 背景とか TensorRTを使おうとしてモデルの一部をONNXのカスタムオペレータにすることがある。(TensorRTのプラグインを使うケース) ただカスタムオペレータを含むモデルはそのままではONNXRuntimeで推論できない。というこ…

TensorRTビルド(とEfficientDet実行環境)のDockerfile作ってみた

AutoML版EfficientDetをTensorRT化しようとして色々あってTensorRTのビルド環境と一緒に環境作りたくなったのでDockerfileとscriptを作ってgitにpushしてみた。 github.com はまったことや注意点を列挙したい。 pycudaより前にnumpyのインストールが必要 set…

TensorRTでfloat型tensorをResizeやSliceの第二以降の引数に指定するモデルが内部エラーになるのでフォーラムに連絡してみた

とあるディープラーニングモデルをONNXに変換してTensorRTで動かそうとしたらInternal Errorが出るのでNVIDIAさんのフォーラムに凸ってみた。 該当スレッドはここ。 モデルに関する簡単な説明 まずはONNXのResizeオペレータとSliceオペレータについて。 Resi…