Machine Learning

お仕事でリアルタイムのMLエンドポイントを立てる事がなく、知見があまりない。単純に、各フレームワークでの実行速度が気になったから雑に比較してみた。実装したコードはこちらのGitHubリポジトリ雑なまとめ Pythonを使う環境ならFastAPIを使えば問題ない。欲を言えば、onnxにモデルを変換しておくのが理想。モデルをonnxに変換できるかつ Rustを利用できる環境なら、Rustでエンドポイントを立てるとより高速な推論が期待できる。比較する条件フレームワーク Python FastAPI Flask Rust(axum, tokio) ort(onnx runtime) tract(onnx runtime) ※ RustのコードはClaudeCodeに書いてもらいましたモデル PyTorch(2層のNN) LightGBM PyTorch ONNX(2層のNN) LightGBM ONNX タスク Titanicの生存予測(2値分類) 学習コードは notebooks/ にある。特徴量 Pclass(Int) Sex(String) Age(Int) SibSp(Int) Parch(Int) Fare(Float) 前処理 Sex → Label Encoding Age → Fill Null(median) Age → Standard Scaler Fare → Standard Scaler 結果各フレームワークで実装したエンドポイントに1000回のリクエストを送信して、計測した結果を集計した。すべて、同じマシン上で実行・リクエストを行っている。 Framework 平均推論時間 (ms) FastAPI 約 1.75 ms Flask 約 2....

自宅サーバーを立てた勉強(遊ぶ)ためになんとなく自宅にサーバーを立てたくなった結果、気づいたら色々ポチっていた。スペック CPU: AMD Ryzen9 7945HX(16Core/32Thread)(Amazonリンク) RAM: DDR5-5200 SODIMM 96GB(48GBx2)(Amazonリンク) GPU: NVIDIA RTX3060 12GBAmazonリンククーラー: Corsair NAUTILUS 240 RSAmazonリンクストレージ: NVMe 2TBAmazonリンク電源: 玄人志向 80PLUS Bronze 650WAmazonリンクケース: LianLi A3-mATX BlackAmazonリンク組む時に考えていたこと PROXMOXを使ってVMを建てたいから、コア数(スレッド数)を多くしたい Ryzen CPUを使ったことがないから使ってみたい VRAMのコスパはAMDの方が良いけど、まだまだCUDAがデファクトスタンダードだから選択しづらいメインPCがあるからGPUにはそんなにお金をかけない。ピカピカゲーミングで眩しくないサーバーで立っているものサーバーはざっくり以下のイメージで構成されている。現時点で、microk8sとDifyのVMが立っている。リソースの配分はこんな感じ。リソース microk8s Dify 余り vCPU 24 4 4 RAM 80 12 4 ストレージ 1TB 512GB 400GB その他 GPU - - microk8s microk8sでは、常時以下のものを動かしている mlflow tracking server MCPサーバー streamlitアプリこれらとは別に、必要な時に動かすものは以下のもの...

Machine Learning

2025-10-20 MLエンドポイントのためのライブラリを雑に比較する

2025-06-19 自作サーバーを立てた