Hibamo

AI

WeightedRandomSamplerによる不均衡クラスの対応

異常検知や分類問題においてほぼ起こりうるのがデータの不均衡問題です。検知したい異常や、特定の分類クラスがどうしても少なってしまうということは多々あります。不均衡クラスに対処する方法としては、多数クラスを減らすダウンサンプリングや、少数クラス...
AI

音声データの画像化 – フーリエ変換からメルスペクトログラムまでをまとめて理解

音声データを処理するAIモデルを構築する際、音声そのままでは特徴を捉えずらいデータであるため、音声特性を予め抽出しておいてあげると学習が安定します。音声特性を抽出した最終形態がメルスペクトログラムとなります。メルスペクトログラムが何かという...
AI

FlowMatchingでMNIST画像生成にトライ

以前の記事でFlowMatcingについて説明しており、その中でMNISTを用いたFlowMatchingのデモ動画を紹介してました。前回記事:Flow Matching – マルチモーダル生成のコア技術 | Hibamo | AI &An...
AI

Flow Matching – マルチモーダル生成のコア技術

2025年にPhisical IntelligenceがリリースしたフィジカルAIモデルの”π0”においてアクション生成として使われているFlow Matching。Flow Matchingは画像や動画生成にも使用される技術となっています...
AI

大規模言語モデル | Kaggle Jigsaw – Agile Community Rules Classification 上位解法概要

今回はKaggle "Jigsaw - Agile Community Rules Classification"を通じて大規模言語モデルのタスク適用方法について見ていこうと思います。(本読んでたら投稿が空いてしまいました。)コンペ内容概要...
AI

時系列センサ処理 | モデル解説 | Kaggle CMI – Detect Behavior with Sensor Data

時系列センサ処理のモデルの知見を深めるために2025年のKaggleコンペ”CMI -Detect Behavior with Sensor Data"の上位解法で使用されているモデルについて見ていきます。他にも色々処理する方法はあると思い...
AI

時系列センサ処理 | Kaggle CMI – Detect Behavior with Sensor Data 上位解法

自然言語処理、プローブデータ処理、将来予想など、時系列データの処理が必要なシーンは結構あると思います。時系列について知見を深めるため、時系列センサを取り扱うKaggleコンペの"CMI - Detect Behavior with Sens...
AI

Cryo-ET 鞭毛モーターの3D検出 | Kaggle BYU 2025 1位解法振り返り

これまでKaggle BYU2025の1位解法について詳細に見てきましたが、最後にそれぞれのポイントを簡単にまとめて全体を眺めてみようと思います。各パートについて基礎・基本とタスク特化で分けていますが、他タスクにも流用できる汎用的なものか、...
AI

Cryo-ET 鞭毛モーターの3D検出 | Kaggle BYU 2025 1位解法コード解説 (推論)

Kaggle BYU 2025 1位解法について、いよいよ最後の推論パートとなります。解法解説からは読み取れなかった内容を確認できたため、そちらについて重点的に見ていこうと思います。コンペ:BYU - Locating Bacterial ...
AI

Cryo-ET 鞭毛モーターの3D検出 | Kaggle BYU 2025 1位解法コード解説 (学習)

Kaggle BYU 2025 1位解法について、これまでモデルからDatasetまで見てきて、今回は学習部分となります。先に結果を言うと、学習部分については性能上げるために尖ったことはしてないです。(尖ったことしてないですが、ひたすら基礎...