登録して招待リンクを共有すると、動画再生報酬と紹介報酬を獲得できます。

検索結果 AI预测
AI预测 コミュニティ
1つのキーワードが1つのコミュニティです。
コミュニティ作成
アカウント
見つかりません
AI预测 を含む検索結果
今天上课摸鱼刷到一条新闻,日本的科技公司又在搞大动作了!听说他们新出的AI助手能预测你下一句想说啥,还顺便帮你点外卖🍱。我试了下,它居然建议我吃章鱼烧(たこやき)...这也太懂我了吧!不过说到web3,感觉日本这边还慢半拍,好多公司还在研究“区块链是什么”的阶段😂 日本科技 AI
もっと見る
AIコードレビューでトークンを燃やしていませんか?🔥 コードを構造グラフ化して、関連ファイルだけ読ませることで、トークンを中央値82倍削減するツールです。 タイトル: tirth8205/code-review-graph URL: 🔥 概要 Tree-sitterでコードベースの構造マップ(グラフ)をローカルに永続化する、ローカルファーストのコードインテリジェンスツールです。AIアシスタントが、リポジトリ全体ではなく文脈的に関連するファイルだけを読んでレビューできるようにします。 ❓ 解決する課題 AIコードレビューツールは、レビューのたびにコードベースの大部分を読み直し、大量のトークンを無駄にします。 ・特に大規模モノレポでは、コンテキストが膨れ上がりコストもレイテンシも悪化します ・変更の影響範囲をスキャンするのに、プロジェクト全体を読む必要がありました 💡 方法論と仕組み 3段階のパイプラインで動きます。 ・パース:Tree-sitterがASTを作り、関数・クラス・import・呼び出し関係を抽出 ・グラフ保存:ノードとエッジをSQLiteに永続化(外部DB不要) ・分析:変更時に影響範囲(blast-radius)分析で、影響する呼び出し元・依存先・テストを辿り最小限の文脈を返す 多言語対応、増分更新は2秒未満、MCP連携(30ツール)、GitHub Action、D3.js可視化を備えます。 📊 実験結果 / 実績 ・トークン効率:38倍〜528倍の削減(6リポジトリで中央値約82倍) ・影響予測のF1スコア:平均0.71 ・CLI例:フル文脈12,921トークン→グラフ文脈762トークン(約94%削減) #コードレビュー# #AIエージェント#
もっと見る
「AIがやめられない。夜10時に思いついたことをAIと話せる。プロトタイプも作れるし、市場調査も競合研究もできる。おかげで疲れ果ててるよ(笑)」 👉 Xのフォロワーは289万人。Boxのアーロン・レヴィCEO は、シリコンバレーの起業家として目撃した「AIの超進化」を発信し続けています。 そしてGPTやClaude、Geminiの最新モデルに、誰よりも早く触れる立場にいます。 私たちの仕事をAIがどう変えるのか。アーロンさんの正直すぎる本音と未来予測をお楽しみください。 @mshrnakagawa
もっと見る
AI、Zeebra主催の女性ラッパー発掘オーディション『GOLDEN MIC』参加決定「みんな応援しています!」【コメント全文】(写真 全2枚)
# AIエージェントをソフトウェアに組み込むプラクティス # コンテキスト予算配分 🎯 「全部入れれば精度が上がる」は幻想です。コンテキストウィンドウは有限の予算として管理しましょう。 スロットごとに配分比率を決め、信号密度を最大化するパターンです。 🔥 解決する課題 RAGやメモリを使うエージェントでは、検索結果・会話履歴・システム指示・長期メモリが同じコンテキストウィンドウを奪い合います。情報を詰め込むほどコストは増え、会話が長くなるとシステム指示の割合が縮んで振る舞いが劣化します。さらに"Lost in the Middle"問題により、窓の中盤に置かれた重要な情報が実質的に無視されてしまいます。 💡 提案パターン コンテキストウィンドウをシステム指示・検索結果・会話履歴・メモリなどのスロットに分け、各スロットに最大占有率と優先度を設定します。システム指示は圧縮対象外の固定枠(10〜20%)として先に確保し、検索結果はリランク後にtop-k件に絞り、履歴は窓使用率が閾値を超えたら要約圧縮します。配置順序はLost in the Middle対策として、最重要情報を先頭に、直近入力を末尾に置きます。cost_sensitivityが高い環境ほどtop-kを絞り、圧縮閾値を下げ、履歴を短く保ちます。 ✅ 選定条件 使うとき: - RAGやメモリを使い、投入候補がモデル窓サイズの50%を超えうる - コスト感度が中以上で、投入トークンの増加がコストや推論時間に影響する - 複数ターンの会話で履歴が蓄積し、他の情報のスペースを圧迫する 使わないとき: - 投入情報がシステム指示+単発入力のみで窓の30%未満に収まる場合 - ロングコンテキストモデルを使い投入量が窓の20%未満、かつコスト感度が低い場合 ⚠️ 落とし穴 - システム指示を圧縮対象にしてはいけません。ツール定義や安全指示が削られると振る舞いが壊れます - リランクなしのtop-kは信号密度が低いです。ベクトル検索上位20件からクロスエンコーダで3〜8件に絞りましょう - 要約圧縮は非可逆です。重要な決定事項や固有名詞が落ちるリスクがあるため、キーワード抽出を併用してください 🔧 実装方針 - コンテキストウィンドウをスロット(system/user/retrieval/history/memory)に分割し、各スロットに最大占有率・優先度・圧縮可否を定義した構造体で管理します - システム指示は圧縮対象外の最高優先度として先に確保し、残りの予算を他スロットに優先度降順で配分します - 検索結果はベクトル検索の上位候補をクロスエンコーダでリランクしてから予算内に収め、信号密度を最大化します - 履歴スロットが予算を超過した場合は要約圧縮を適用し、圧縮前にキーワード抽出して重要情報の欠落を防ぎます #AIエージェント# #ソフトウェアアーキテクチャ#
もっと見る
AI関連のポストでフォロワーふえたうれし!となってよくよく見たら例のAI生成のBOTだった…。かなしみのブロック😢 彼らは紫陽花が好きなようで…
もっと見る
# AIエージェントをソフトウェアに組み込むプラクティス # 階層化メモリ 🎯 「全部コンテキストに詰め込む」設計は、ウィンドウ溢れとハルシネーションの永続化を同時に引き起こします。 メモリを3層に分けるだけで、コンテキスト効率と記憶の信頼性を両立できます。 🔥 解決する課題 エージェントが複数ターンに跨がるタスクを扱うとき、すべての情報をコンテキストウィンドウに詰め込む「フラット記憶」では2つの問題が同時に起きます。会話履歴・ユーザ属性・中間結果・外部知識が混在するとウィンドウが溢れ、古い情報から押し出されて文脈が断絶します。さらにLLMが生成した推測をそのまま永続化すると、ハルシネーションが長期記憶に定着し、以降のセッションを汚染し続けます。 💡 提案パターン メモリを作業記憶(ターン内の中間状態)・短期記憶(セッションストア、TTL付き)・長期記憶(ベクトルDB/KVS)の3層に分離します。作業記憶は自由に読み書きし、コンテキストリセットで消えます。短期記憶には信頼度タグを付与し、ユーザ発話由来は高信頼、LLM推測由来は低信頼とマークします。長期記憶への昇格には反復確認やユーザ承認を要求し、ハルシネーションの永続化を防ぎます。failure_costが高い領域ほど昇格閾値を厳しくし、TTLを長めにとって安全側に寄せます。 ✅ 選定条件 使うとき: - 複数セッションにわたって情報を引き継ぐ必要がある - 中間結果の量がコンテキストウィンドウの30%を超える見込みがある - 確定事実と推測の区別が必要で、誤った記憶の波及影響が大きい 使わないとき: - 1ショットで完結しセッション間の引継ぎが不要な場合 - コンテキストウィンドウに全情報が収まる場合 - メモリの書込制御だけが課題で、階層分離自体は不要な場合 ⚠️ 落とし穴 - 作業記憶と短期記憶の境界が曖昧になりがちです。外部ストアへの書込を境界線にし、LLMの内部状態に頼らないでください - 長期記憶のエントリ数が増えると無関係な記憶がコンテキストに混入し、ハルシネーションの原因になります - マルチエージェント構成で各Workerが直接長期記憶に書き込むと整合性が崩れます。長期記憶はSupervisorが一元管理しましょう 🔧 実装方針 - 作業記憶(dict/インメモリ)・短期記憶(Redis等TTL付きセッションストア)・長期記憶(ベクトルDB)の3層を明確に分離し、外部ストアへの書込を境界線とします - recall時はコンテキスト予算内で3層から関連情報を想起し、関連度と信頼度でランク付けして注入量を制御します - 短期→長期への昇格には信頼度スコアの閾値チェックと承認状態の検査を設け、未検証情報の永続化を防ぎます - 記憶種別ごとにTTLを設計し(リアルタイムデータは分単位、ユーザ嗜好は週単位、不変属性は無期限)、failure_costが高いほど短めに設定します #AIエージェント# #ソフトウェアアーキテクチャ#
もっと見る