分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

Ahmad

AI 研究者兼ソフトウェアエンジニア、DGX B200 GPU クラスターの構築をミッションに

ステップバイステップのLLMエンジニアリングプロジェクト各プロジェクト=1つのコンセプトを苦労(つまり、実際の)方法で学んだトークン化と埋め込み > バイトペアエンコーダーの構築 + 独自のサブワード語彙のトレーニング > 単語/チャンクを ID にマッピングする「トークンビジュアライザー」を記述します > one-hot と learned-embedding: プロットコサイン距離位置埋め込み >古典的な正弦波 vs 学習 vs RoPE vs ALiBi: 4 つすべてのデモ > 3D で「位置エンコード」されるおもちゃのシーケンスをアニメーション化します > アブレート位置 - 注意が崩壊するのを見てくださいセルフアテンションとマルチヘッドアテンション > 1 つのトークンに対する手作業のワイヤドット積の注意 > マルチヘッドにスケールし、ヘッドあたりの体重ヒートマップをプロットします将来のトークンをマスクする>、因果関係の特性を検証する変圧器、QKV、スタッキング > Attention実装をLayerNormと残差をシングルブロックトランスフォーマー→スタックします >一般化:おもちゃデータのnブロック「ミニフォーマー」 Q、K、Vを解剖する>:それらを交換し、壊し、何が爆発するかを見てくださいサンプリングパラメータ:temp/top-k/top-p サンプラーダッシュボードのコーディング> — temp/k/pとサンプル出力をインタラクティブに調整 > パラメータをスイープする際のエントロピーと出力の多様性をプロットします > nuke temp=0 (argmax): 繰り返しを見る KVキャッシュ(高速推論) KV 状態を記録して再利用する>。高速化とキャッシュなしの測定 > トークンストリームの「キャッシュヒット/ミス」ビジュアライザーを構築する > 長いシーケンスと短いシーケンスのプロファイルキャッシュメモリコストロングコンテキストのトリック:Infini-Attention / Sliding Window > スライドウィンドウアテンションを実装します。長いドキュメントで損失を測定する >ベンチマークの「メモリ効率が高い」(再計算、フラッシュ)バリアントプロットの困惑とコンテキストの長さ>。コンテキストの折りたたみ点の検索専門家の混合 (MoE) > 2 エキスパートルーターレイヤーをコーディングします。トークンを動的にルーティングする > データセットに対するエキスパート使用率ヒストグラムのプロット > スパース/ミックススワップをシミュレートします。FLOPの節約を測定するグループ化されたクエリアテンション > ミニフォーマーをグループ化されたクエリレイアウトに変換する > 大ロットでバニラマルチヘッドの速度を測定 > グループ数をアブレートし、レイテンシーをプロットします正規化とアクティベーション > LayerNorm、RMSNorm、SwiGLU、GELUを手作業で実装それぞれをアブレーション>、トレーニング/テストの損失はどうなりますか? > 活性化分布をレイヤーごとにプロットします事前トレーニングの目的 > おもちゃのテキストにマスクされた LM と因果関係の LM と接頭辞 LM をトレーニングします >損失曲線をプロットします。どちらが「英語」を早く学ぶかを比較それぞれからサンプルを生成する> — 癖に注意フィネチューニング vs 命令チューニング vs RLHF > 小さなカスタムデータセットを微調整するタスクの先頭に ("Summarize: ...") を付けて命令を調整> > RLHF: 報酬モデルをハッキングし、PPO を 10 ステップ使用し、報酬をプロットするスケーリング法則とモデル容量 > 小規模、小規模、中規模のモデルをトレーニングする — プロット損失とサイズ >ベンチマークウォールクロック時間、VRAM、スループットスケーリング曲線を外挿する>、どれだけ「愚か」になれるでしょうか? 量子化 >コード:PTQ&QAT;GGUF / AWQにエクスポートします。プロット精度の低下推論/トレーニングスタック: > HuggingFace から Deepspeed、vLLM、ExLlama にモデルを移植します > プロファイルスループット、VRAM、3 つすべてのレイテンシ合成データ > おもちゃデータの生成、ノイズの追加、重複排除、評価分割の作成 > 実際のシンセでモデルの学習曲線を視覚化する各プロジェクト = 1 つのコアインサイト。建てる。陰謀。壊す。繰り返す。 >理論上、あまり長く立ち往生しないコード>、デバッグ、アブレート、さらにはグラフをミーム化します笑 >それぞれを終えて、学んだことを投稿してください未来の自分は後であなたに感謝するでしょう

トップ

ランキング

お気に入り