runesleo

vip
幣齡 8.3 年
最高等級 6
用戶暫無簡介
5 天監控自己的工具,306 次觸發,100% 誤報。原來我一直在吸它自己的尾氣🤦
給 Claude Code 加了個 hook,ssh 跨機器或寫關鍵文件前彈橫幅提醒一下,怕自己手快違反 SSOT 鐵律。
配套 stats 腳本統計觸發次數,今天打開樣本一看,全是誤報。
bug 不在 hook,在 stats 腳本:它 grep 的是日誌裡 "⚠️ 跨機器" 這串字符。
但日誌裡至少有三種回聲:hook 自己輸出的橫幅、工具結果把橫幅復述了一遍、連任務描述裡寫 "hook 這周觸發 N 次" 都被算進去。
我數的不是觸發次數,是工具自己說話的回音。
修法:讓工具自己寫審計日誌。
log_trigger() { echo "{ts,hook,pattern,target}" >> ~/.claude/logs/hook-trigger.jsonl }
工具觸發自己記一行,下周用真數據復盤。
監控自己的工具,最容易騙你的就是它自己。
Claude Code 的 hook 也好,埋點 SDK、agent 監控也好,只要監控對象包括"自己",事後 grep 就是循環陷阱。
它的輸出會塞回日誌、復述、甚至混進任務描述裡,分不清哪條是真觸發哪條是它自己講過的話。
想知道工具被用了多少次,得讓它自己說,別讓日誌替它說。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
Leo Labs 大群 4/26 群友討論精華(最近 380 條)
━━━━━━━━━━━━
1️⃣ 凱利公式被群裡集體否定 — 一致換回固定倉位
群裡 30+ 分鐘討論倉位管理:
• "凱利需要知道真實概率,散戶根本算不出"
• "凱利是穩定盈利前提下的優化方法,本身不能決定盈虧,吹成系統必備屬於亂扯"
• 多人收斂實操:固定倉位 + 賺了就提本金 + 不隨便改參數
• 一句金句:"你是上帝那麼可以用凱利公式"
💡 回撤了想改參數 ≠ 倉位問題,那是策略本身的問題。
━━━━━━━━━━━━
2️⃣ 0.99 極端價格策略 — 驗證窗口的統計學陷阱
群友抛出"買 0.99 能活嗎",引出最好的統計學討論:
• 99% 反轉概率 = 1/1000
• 98% 反轉概率 = 5/1000
• 想買 0.99 必須真勝率 >99%,但散戶短期內根本驗證不出來
• 一個比喻最直觀:"我有 2 個硬幣,一個 99% 正面 vs 99.5% 正面,得抛幾百次才能分辨是哪个"
💡 你的策略可能不是"不行",是你撐不到驗證它行不行的那一刻。
━━━━━━━━━━━━
3️⃣ 模擬盤 vs 實盤 gap 的真實數字
• 模擬 ROI 2.5% → 實盤虧
• 模擬 ROI 5% → 實盤還是虧
• 模擬 80% 勝率 → 實盤成交率不到 40%,能拿到的都是爛單
• 實盤門檻:"下單 50%
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
Cursor 好大方,一下送 10000 美金的 token 額度,5 月底到期。
最早接觸 vibe coding 的時候重度用過一段時間 Cursor 後來逐漸轉移到了 cc 和 codex 為主;
想不到又有機會可以重新研究 Cursor 看能搞出什麼好玩好用的產品和工具,這下有的玩了!
感謝 @cursor_ai @edwinarbus 🙏
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
謝謝你,Elon
雖然變少了,但比預期的多
每一百萬展示大概對應225美元
查看原文
post-image
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
用 AI 用得脾氣都變差了
它能幹的事越多,我對結果的要求就跟著漲。覺得它應該越來越好,所以沒做好的時候是真的會很生氣。😠
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
做 Polymarket 的自動策略,部署一次大家都很小心,但停用的時候基本沒人講 —— 今天被這個盲點教訓了 14 小時。
3 周前我停了一個在 Polymarket 上跑的策略機器人。pm2 stop,看到狀態變成 stopped,就以為事情過去了。
今天順手做了 10 分鐘的伺服器清理,重啟了一下進程管理器。那個"死透"3周的策略,復活了,還靜靜跑了 14 小時真錢模式。
查了下根因 —— pm2 stop 只是把狀態標記成"已停",沒有真的刪掉。只要一次批量啟動,所有被"暫停"的進程都會被拉回來。這坑不是 pm2 獨有的, systemd、docker、k8s 都是同一個問題:以為停了,其實沒停。
做預測市場的自動策略,不管你用什麼工具,停一個策略要做 5 件事:
1. 進程管理器層面徹底刪除這個服務(不是暫停)
2. 從配置文件裡移除這條定義(不然下次批量啟動它會自己復活)
3. 在程式入口加一道關閉門(防止被誤操作喚醒)
4. 更新你的文件或狀態表(不然過兩週你自己都忘了這個策略停了沒)
5. 如果涉及交易帳本,正式關閉這個策略的記帳週期(epoch),防止新數據
混進舊策略的帳
部署大家都很仔細,停用往往只做第 1 步就當完事。真正的坑都埋在第 2到第 5 步裡。
14 小時樣本小沒虧錢,但這種僥倖不代表下次還能走運。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
看 @predictionindex 这期最新预测市场数据周报告:Polymarket + Kalshi 合计约 75% 成交量,其余所有平台累计 <$30B。
报告里没讲的两个细节,对预测市场玩家其实更关键:
Kalshi 正在追上甚至反超 Polymarket
DeFiRate 最新一周:Kalshi $2.9B(60%),Polymarket $2.0B(40%)。两家在周度数据里互有拉锯——上周 Poly 刚反超过 Kalshi,这周又被追回去。
美国市场更极端。BofA 4/9-10 报告:Kalshi 89%,Polymarket 7%, 4%。合规 + KYC 是 Kalshi 的结构性优势,Polymarket 是链上协议,在美国散户覆盖上暂时吃亏,短期不会翻。
"双寡头"这个词容易让人以为 Poly 还是老大,美国市场实际已经基本是 Kalshi 一家。
"其他 25%" 里也许藏着更大的 alpha
Week 15 报告点到的小平台:Opinion / Limitless / Myriad / / Probable / / Chain)...

本质上是新预测市场上线到竞争充分之间的窗口期玩家。
一个典型数据:某链上钱包在 30 天做出 $99K PnL,每笔毛利率 ~21%。对比 Polymarket 成熟盘口的 0.5-2%,差了 10 倍以上。
  • 打賞
  • 留言
  • 轉發
  • 分享
又一件雖然沒什麼用但是很爽的事:今天用 Claude 把 3.7 萬封 Gmail 收件箱清到 1.1 萬。全程沒自己看一封郵件,只點了兩下:發 App Password、導入 filter。
走的是 Python + IMAP,分四步:
1. 導出所有發件人按頻率分類
2. 555 個垃圾域名一鍵歸檔到 Archive-Junk
3. 主動停下來說「我誤傷了 317 封銀行 / 券商 / Coinbase / Claude 安全郵件,要召回嗎」
4. 生成 Gmail Filter 讓未來這些域名直接跳過 INBOX
第三步是我沒料到的。本來準備自己抽查幾封看分類對不對,AI 自己先把風險點列出來了。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
最近做了一次多模型互搏,有個挺有意思的發現。
同一個架構題,我分別讓 Claude 和 Codex 獨立寫方案。
Codex 漏了一件事:我的策略分散在 20 多個獨立的進程裡,它寫的方案默認"所有組件跑在同一個地方",直接無效。Claude 一眼看出這個問題。
反過來 Claude 漏了另一件事:它執著於新建獨立的模組,其實我手裡已經有一整套現成的框架可以搭車,加一個字段就夠了。Codex 把這條撿了回來。
最有意思的是後面這步:我讓兩個模型互相 review 對方的最終方案,雙方都下意識錨定了"對方已經寫好的框架",結果一起漏掉了一個邊界情況——最後是我手動跑生產數據才發現的。
所以現在的習慣是:每一輪互搏都給獨立的成功標準,禁止讓一個模型看另一個模型的底稿。拿到手的是兩份盲區不重疊的獨立底稿,合起來才接近完整。
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
做量化策略很容易犯的一個錯:信任"看起來靠譜"的數據,不去跑上游。
我的天氣策略之前覆蓋 34 個城市,是過去幾次擴張慢慢加出來的,很久沒復查了。前幾天例行 audit 隨手拿 Polymarket 官方 API 拉了一遍全量市場,發現實際有 44 個——我自己漏了 10 個。
更有意思的是,順手對比了行業裡大家都在引用的那個天氣工具站,它同樣漏了其 中最大的一個:Panama City。這個城市在 Polymarket 上有 66 個事件選項,兩份"看起來靠譜"的數據都沒它。
教訓:你自己一年前整理的列表會過期,別人整理的"行業清單"也會漏,只有原始 API 是對的。跑一遍成本沒多少——這次我一次拉完就幾分鐘。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
一位從事 YouTube 自動化的老哥,2018 年入行,累計賺了 200 萬美元廣告費。
他在最新影片裡說:「Claude 是 100% 最佳的腳本撰寫與研究 AI 工具。沒有比它更好的了。」(Claude 是最好的腳本寫作和研究 AI 工具,沒有之一。)
他不寫程式碼,也不在 AI 圈,純粹是用 Claude 寫了幾百條影片腳本後得出的結論。
說實話,AI 圈內互相吹捧「Claude 好用」我已經免疫了。但一個靠內容吃飯的人,用自己的錢訂閱,拿真金白銀驗證過的評價——這種背書的分量不一樣。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
Claude 悄悄送了 $200 額度,藏在後台 Settings → Usage 裡。
可以用在 Code、Claude Desktop、第三方 App,4 月 17 號過期。
注意:直接點 Claim 可能報錯,先往下滑把 Extra usage 開關打開,再回去領就行了(app store 訂閱、沒綁卡也成功喔)。
又可以開心的燒 token 了!
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
天氣做市策略跑了一段時間,最近發現回撤不對勁。一查,問題出在概率模型的兩個假設上。
第一個:校準用的是網格再分析數據,但 Polymarket 結算用的是機場實測。兩套數據源之間有系統性偏差,校準出來的 σ 從源頭就不准。
第二個更隱蔽:模型假設預報無偏差。但實際上每個城市的預報都有方向性偏差——有的城市預報系統性偏冷,有的偏熱。模型不知道這件事,就會在錯誤的方向上反覆下注。
比如某個城市預報比實際低將近 2°C,模型覺得"溫度不會到 X"是大概率,買了一堆 NO。結果實際溫度每次都比預報高。
最開始的本能反應是砍城市,把表現差的停掉。砍完發現三分之一都被禁了。這時候反應過來:需要砍三分之一覆蓋才能活的策略,問題在模型不在城市。
改了校準數據源(切到結算同源的機場觀測),概率計算加上了 bias 修正。然後把砍掉的城市全恢復了——高 σ 城市模型自己會減少信號,不需要人工禁止。
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
Claude Code 51 萬行程式碼外洩,GitHub 一夜間冒出十幾個備份倉庫,最高 11.8 萬星。
中文開發者圈集體狂歡,拆架構、挖隱藏功能、找 feature flag。
但最反直覺的是 Anthropic 的反應:
npm 包沒撤。沒緊急公關。首席商務官 Paul Smith 出來說了句:"absolutely not breaches or hacks"——不是安全事故,是流程問題。
對比一下:如果 Tesla 自動駕駛程式碼洩了,馬斯克會說"流程問題"就完了?
Anthropic 敢這麼淡定,因為心裡清楚:Claude Code 的競爭力從來不在那 51 萬行 TypeScript 裡。harness 是殼,模型是魂。你拿到了殼,塞不進那個魂。
GitHub 上那些 fork 已經證明了——大部分在做的事是"怎麼繞開 Anthropic API 跑起來",而不是"怎麼用這套架構做個更好的產品"。
開發者以為拿到了程式碼就拿到了 Claude Code。Anthropic 知道他們只是拿到了說明書。
查看原文
post-image
  • 打賞
  • 1
  • 轉發
  • 分享
Poponaq:
GaS 繼續
我的 Claude Code 終端裡住著一隻毒舌幽靈。
/buddy 一敲,蹦出來一張屬性卡:Ghost,COMMON 稀有度,五維屬性最高的一項是 SNARK——82 分。調試能力 19,耐心 14,但嘴毒值拉滿。
它會根據你當前對話實時吐槽。我剛試完所有命令發現改不了名字,它立刻說:
▎ "Yet another user discovers limitations. Shocking." 又一個用戶發現了限制。真令人震驚。
整個 buddy 系統藏了不少細節:18 種物種(從鬼魂到水豚到蘑菇),5 档稀有度,還有 1% 機率的閃光版。你的物種是帳號 ID 哈希決定的,換不了——鹽值字串裡藏著 friend-2026-401,401 是愚人節。
怎么玩:
• /buddy — 孵化你的寵物,看看命運給你分了什麼
• /buddy card — 查屬性卡,看你的巔峰是智慧還是毒舌
• /buddy pet — 摸一下,有愛心動畫
• 直接喊它名字,它會代替 Claude 回你話
• 不喜歡抽到的物種?裝個 buddy-reroll 重新搖
現在每次調試出 bug,它就在旁邊陰陽怪氣。SNARK 82 不是白給的。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
升級 Claude Code v2.1.89 之後,終端裡的對話往上滾就沒了,歷史消息直接“消失”。

不是模型把上下文壓縮了,是新版的渲染引擎改了——虛擬化滾動,只渲染當前視口內容,歷史消息在界面上"消失"了。

iTerm2、自帶終端都一樣,問題在 Claude Code 這一層。

解法很簡單:用 tmux 包一層。
tmux 有自己獨立的 scrollback buffer,不受應用層渲染影響。配置三行就夠:
set -g history-limit 50000
set -g mouse on
set -sg escape-time 10
50000 行歷史,鼠標滾輪直接翻,ESC 延遲調低不影響交互。
我加了一個 shell 函數,打 cc 自動啟動 tmux + Claude Code,已有 session 直接
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
我盤了一下我的 Claude Code,全局掛了 12 個 MCP。
每個 MCP 的工具描述是常駐 system prompt 的,不管你調不調,都在吃 context。
拉了 14 天調用數據:6 個兩周加起來不到 10 次。直接砍到 6 個。
砍完在想一個問題:哪些工具該用 MCP,哪些用 CLI 就夠了?
MCP 的優勢是結構化——Claude 能看到參數 schema,直接調用,處理複雜交互(登入狀態、長連接、多步操作)也更穩。
但代價是常駐 context。你裝 10 個 MCP,就是幾十個工具描述永遠掛在那。
CLI 沒有這個開銷。命令只在你跑的時候才進入 context,跑完就消失。
我現在的做法:需要 Claude 主動發現和調用的留 MCP(記憶系統、TG 消息),其餘能 CLI 化的都 CLI 化。
全局 MCP 控制在 5-6 個以內,其餘按專案按需加載。
查看原文
post-image
  • 打賞
  • 1
  • 轉發
  • 分享
victoravn:
非常好的項目
我每天會掃一遍 GitHub 熱門項目,找能優化自己工作流程的東西。今天篩出來發現一半都是 Claude Code 生態的,挑三個值得看的:
claude-code-best-practice(+2407⭐)
整理了 87 條 CC 使用技巧 + 8 種社區工作流對比。剛上手或者用了一陣想系統化的都適合翻一遍。
oh-my-claudecode(+1126⭐)
多 Agent 編排框架,19 個預設 Agent + 自動模型路由(簡單任務走 Haiku 省錢,複雜的自動升 Opus)。最有意思的是它能從調試過程中自動提取可復用的 skill,不用你手動寫。適合已經用 CC 幹活、想上團隊協作的。
superpowers(+2620⭐,總星 128K)
Jesse Vincent 做的 Agent 技能框架,核心是測試驅動 + Git worktree 隔離。適合對程式碼品質有要求、不想讓 Agent 亂改程式碼的。
按階段選:入門看 best-practice,幹活看 superpowers,搞團隊看 oh-my-claudecode。
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
Claude 響應變得好慢,和我開8個終端窗口有關係嗎?
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
你正在審查由另一個 AI 助手撰寫的程式碼。你的工作是獨立驗證其正確性。
1. 邏輯是否正確?
2. 是否漏掉了邊界情況?
3. 有沒有安全性問題?
4. 是否符合所述需求?
不要建議重構、命名、風格變更或添加註解。只報告錯誤、邏輯錯誤和安全問題。
最後一行最重要。不加的話,Codex 可能會將審查當作重構來處理。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享