Mac で VS Code、Continue、Ollama + Qwen2.5-Coder を使用して無料のローカル AI プログラミングアシスタントを構築

最近 Cursor というプログラミングツールが非常に人気を集め、多くの開発者の注目を浴びています。しかし、Cursor は強力な機能を持っているものの、その高額な価格が多くの個人開発者や小規模チームにとっては手が届きにくいものとなっています。また、Cursor に似たツールはすべてクラウドベースの大規模モデルに依存しており、プライバシーを重視する多くの人々は、ローカルの大規模モデルを使用したいと考えています。これらの理由から、この記事では Mac ユーザー(できれば M シリーズチップを搭載した高性能なコンピュータが推奨されます)向けに、VS Code、Continue プラグイン、Ollama Qwen2.5-Coder を使用したローカルオープンソースソリューションを紹介し、より低コストで AI プログラミングアシスタントの強力な機能を体験できる方法をお伝えします。 システム環境 macOS Sonoma 14.6.1 VSCode 1.93.1 Continue …...

論文メモ:ASLFeat:正確な形状と位置特定のための局所特徴の学習

本文は D2-Net に基づいたさらなる改良であり、主な革新点は以下の通りです: 1)Deformable Convolution を使用して密な変換推定と特徴抽出を行う 2)特徴ピラミッドを使用して空間解像度に適応し、low-level の詳細を使用して正確な特徴点の位置を特定する 1 方法 1.1 前提条件 本文のネットワーク設計は、以下の2つの研究に基づいています:DCN と D2-Net、まずこれら2つの研究の主な考え方を振り返ります: Deformable convolutional networks (DCN) 変形可能な畳み込み (Deformable Convolutional Networks, DCN) の目的は主に動的な受容野を学習することです。従来の畳み込みに対して、その式は次の通りです:...

論文メモ:NeRF: 視点合成のためのニューラル放射場としてシーンを表現

NeRF は ECCV 2020 の Oral であり、非常に大きな影響を与えました。基礎から神経ネットワークに基づく暗黙的な表現を使用してシーンを再構築する新しいアプローチを生み出したと言えます。そのシンプルなアイデアと完璧な効果により、現在でも多くの 3D 関連の研究がこれを基礎にしています。NeRF が行うタスクは Novel View Synthesis(新しい視点の合成)であり、いくつかの既知の視点でシーンを観測(カメラの内部・外部パラメータ、画像、ポーズなど)し、任意の新しい視点で画像を合成します。従来の方法では、このタスクは通常、3D 再構築とレンダリングを組み合わせて実現されていましたが、NeRF は明示的な 3D 再構築プロセスを行わず、内部・外部パラメータに基づいて直接新しい視点のレンダリング画像を生成することを目指しています。この目的を達成するために、NeRF は神経ネットワークを使用して …...

IROS 2021 ヒルティSLAMチャレンジ優勝アルゴリズムの振り返り

近日私たちのチームが参加した IROS 2021 The HILTI SLAM チャレンジで最終的な優勝を果たしました。この記事は今回のコンペティションにおけるアルゴリズムの実験と考察です。著作権所有:メグヴィジョンテクノロジー。元記事リンク:https://zhuanlan.zhihu.com/p/420192586 近日、IROS 2021 The HILTI SLAM チャレンジの結果が発表され、メグヴィジョン研究所が今回のチャレンジで優勝しました。これは昨年の CVPR 2020 SLAM チャレンジの全てのトラックで優勝した後、メグヴィジョン研究所が再びトップカンファレンスの SLAM コンペティションで優勝したことを意味します。2021 HILTI SLAM チャレンジは国際トップ会議——インテリジェントロボットとシステムに関する国際会議(IEEE/RSJ International Conference on...

論文ノート:バックプロパゲーションによるPnP最適化でエンドツーエンド学習可能な幾何学的ビジョン

本文は、従来のPnP手法と深層学習の組み合わせに関するいくつかの研究を行い、全体的な考え方は比較的シンプルで、主に従来のPnP手法の残差をどのようにしてニューラルネットワークに逆伝播させるかに焦点を当てています。これにより、End2Endのトレーニングが可能になり、データの関連付けが不要な計算(Blind PnP)も実現できます。 1 Backpropagating a PnP solver (BPnP) まず、数学的な言語でPnP問題を説明します。 gをPnPソルバーと定義し、その出力yは6DoFの姿勢を解くものです: ここで、xは画像上の特徴点の2D座標観測を表し、zは空間内の3D点座標を表し、 は一対一の対応関係を示すマッピング、Kはカメラの内部パラメータです: 実際、PnPを解くことは次のような最適化問題です: ここで、  は投影関数であり、 は再投影 …...

CVPR 2021 画像マッチングチャレンジ 二冠アルゴリズムの振り返り

借りて、以前に私たちが会社に提供した記事をもとに、最近のコンテストでのいくつかの実験と考察をまとめます。本文の著作権は:旷视科技に帰属します。元のリンク:https://www.zhihu.com/question/32066833/answer/2041516754 Image Matching(イメージマッチング)は、コンピュータビジョン分野における最も基本的な技術の一つです。これは、疎または密な特徴マッチングの方法を通じて、2枚の画像の同じ位置の局所情報を関連付けることを指します。Image Matchingは、ロボット、無人車、AR/VR、画像/商品検索、指紋認識など、多くの分野で広く応用されています。 今年終了したばかりのCVPR 2021 Image Matchingコンテストでは、旷视3Dチームが2つの優勝と1つの準優勝を獲得しました。この記事では彼らの比 …...

論文メモ:Linear Attention Mechanism: 効率的なセマンティックセグメンテーションのための注目機構

古典的なDot product Attentionは大きな空間と時間の複雑さを持ち、効果は優れているが、画像と動画の入力データ量はテキストよりも多いことが多いため、これらの古典的なAttentionは高解像度画像での応用が制限されます。本論文では、これらの問題を解決し、パフォーマンスに大幅な劣化が生じないように、新しい線形のAttentionモジュールを提案します。 この論文の主な貢献点は次の通りです: 1) 新しい線形Attention方式を提案し、計算複雑度をからまで低減します 2) このAttentionメカニズムにより、Attentionとネットワークの組み合わせがより汎用的で柔軟になります; 3) 意味分割タスクにおいて、このAttentionメカニズムを導入することで、複数のベースラインでパフォーマンスが向上しました。 1 方法論 A.ドット積注意の定義 给定一个输入的特征向量 ,其中  代表特征长度, 代表特征维度。那么 Dot-Product Attention 通过点乘变换矩阵 、 以及  分别生成 Query Matrix、Key Matrix と Value Matrix ,其公式如下: ここで、Q と K の次元は同じでなければなりません。 在此基础上,引入一个归一化函数  来度量  和  的相似度 。而 Scaled...

[Mac] VS Code で Clash プロキシを設定する方法

VS Code で、IntelliCode や Claude Dev などのプラグインは、Proxy を通してアクセスする必要がある場合があります。以下は Clash プロキシを使用する設定方法です。他のものも同様です。 0. システム環境 macOS Sonoma 14.6.1 Clash for Windows 0.20.391. システム設定...