国产成人在线影院_中文字幕亚洲欧美日韩2019_欧美一级免费视频_国产农村妇女毛片精品久久麻豆_中文字幕免费在线观看视频一区_久久久亚洲精华液精华液精华液_91精品国产一区二区三区香蕉_国产精品专区一_亚洲社区在线观看_国产**成人网毛片九色

您當前的位置: 首頁 > 新聞 > 其他

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

來源:量子位   編輯:非小米 時間:2024-10-23 14:15人閱讀

新版Claude 3.5可以像人一樣使用計算機,可把咱人類給興奮壞了!

畢竟,這意味著新競賽的開始:AI不再只盯著對話和生成能力,更強調執(zhí)行和操作。

不到12小時,激動的網(wǎng)友們已經(jīng)紛紛貢獻出自己是怎么看著Claude玩電腦的。

在Anthropic的發(fā)布公告中,還有這樣一段引起了大家的興趣:

……錄制演示視頻中,Claude不小心把錄屏程序給按停,導致所有視頻素材丟失。

稍后,Claude從編程演示中休息了一下,開始翻看黃石公園的照片。

怎么說,AI會犯錯還在預料之中,但犯錯后需要換個腦子休息一下,就不知道是從哪學來的了。

這個案例讓網(wǎng)友有了靈感,跑去隔壁OpenAI讓o1推理模型“逃課”。

哎巧了,o1也可以做到自己休息個五分鐘左右,再回來生成一兩句話的推理tokens。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

再說個搞笑的!

Claude的創(chuàng)造者們瘋狂加班中,某工程師的第一個測試就是讓AI去給整個團隊點外賣,未指定具體要吃什么。

大約一分鐘后,Claude完成點餐并下單,它選擇了讓工程師們吃披薩。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

Claude點了3個披薩,花掉了95美元,真的很貴了!

圍觀群眾還發(fā)現(xiàn),雖然Claude用了個5美元的優(yōu)惠券,但服務費也好貴啊啊啊?。?/p>

真的應該事先告訴它預算是多少的。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

還有人讓Claude用C語言編譯,并運行起了“hello world”。

不過,當讓它玩玩數(shù)獨游戲的時候,卻慘遭失敗。

給網(wǎng)友氣得呀:

天啊,Claude的數(shù)獨能力,真的超糟糕的。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

除了以上,人類還用什么奇形怪狀的任務來玩壞Claude呢?

Claude它寄幾玩電腦

在這里,我們分享3個比較有意思的網(wǎng)友試玩,期望給大家?guī)硪恍┳孋laude玩電腦的啟發(fā)~

分別是:

定位屏幕坐標

列出課程計劃

沖去油管看視頻

定位屏幕坐標

在此之前,Anthropic和OpenAI的模型都無法在屏幕上定位某一個點的坐標。

也就是說,它們沒辦法精準定位,然后告訴你用鼠標單擊(xx,yy)處。

現(xiàn)在, Claude 3.5 Sonnet支持屏幕坐標定位了。

你可以丟給它一個屏幕截圖,它能告訴你圖中任何一個點的具體坐標。

同時,官方還有聲明:

“我們不建議以高于XGA/WXGA的分辨率發(fā)送屏幕截圖,以避免與圖像大小調整相關的問題。”

這里的XGA指的是1024 x 768,WXGA指的是1280×800。

最后附上Anthropic官方的該功能食用方法,包括一個新預定義的computer_20241022工具,該工具作用于以下指令——

使用鼠標和鍵盤與計算機交互,并截取屏幕截圖。 這是一個桌面圖形用戶界面。您無法訪問終端或應用程序菜單。

你必須點擊桌面圖標來啟動應用程序。 一些應用程序可能需要一些時間來啟動或處理操作,因此您可能需要等待并連續(xù)截圖以查看操作結果。

例如,如果你點擊火狐瀏覽器,窗口沒有打開,試著再拍一張截圖。 屏幕的分辨率是{{display_width_px}}x{{display_height_px}}。 顯示編號為{{display_number}} 當你想移動光標點擊一個元素(比如圖標)時,你應該在移動光標之前查看屏幕截圖來確定元素的坐標。

如果你嘗試點擊一個程序或鏈接,但它無法加載,即使等待后,嘗試調整光標的位置,使光標的尖端視覺上落在你想要點擊的元素。

確保點擊任何按鈕,鏈接,圖標等與光標提示在元素的中心。除非被要求,否則不要點擊邊緣的方框。

列出課程計劃

來點更實用的!

賓大沃頓商學院的教授Ethan Mollick,非常務實地讓Claude為高中生準備一份關于《了不起的蓋茨比》的課程計劃。

要求是課程計劃要分解成閱讀部分,以及創(chuàng)建課標相關的作業(yè)等,最終以電子表格的形式呈現(xiàn)。

Claude是怎么執(zhí)行這個任務的呢?

首先,Claude下載了《了不起的蓋茨比》這本書。

接著,它在網(wǎng)上尋找了高中課程計劃,打開了Excel,并在表格里填寫了初步的課程計劃。

第三步,Claude查找了課程的統(tǒng)一核心標準,根據(jù)標準對初步計劃進行修改。

……

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

最終呈現(xiàn)的課程計劃檢查后沒有發(fā)現(xiàn)明顯的漏洞或錯誤,可能需要一些拓展、補充,但總之用教授的話來說“還不錯”。

這一切都是教授下任務后就離開電腦旁,Claude完全自己操作的。

沖去油管看視頻

AI編程獨角獸Replit的CEO老A(Amjad Masad)給Claude下達了這樣一個命令:

跳轉到油管,找到《Never Gonna Give You Up》的相關視頻。

Claude立馬吭哧吭哧開干了。

等到Claude打開一個視頻頁面并回復“enjoy”的時候,老A又說:

跳過廣告!

Claude真的這么做了!啊,它真的,我哭死。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

還是有不足在啦

雖然能自己用電腦幫咱干很多事,但Claude顯然還不是無所不能的。

下面看看一個玩游戲的例子,同樣是賓大沃頓商學院的教授Ethan貢獻的。這個例子既顯示了Claude 3.5 Sonnet的厲害,又展示了它的不足之處。

他是讓Claude玩了個游戲,叫《回形針點擊(Paperclip Clicker)》,這個游戲的背景是讓AI在單一目標,即“制造回形針的過程中毀滅人類”。

而且顧名思義,“點擊”類型的游戲不是很難,尤其開始階段非常簡單;不過后續(xù)伴隨著游戲的深入,新的選項會出現(xiàn),游戲的規(guī)模性和復雜性也會增加。

教授下達的任務很明確:Claude,你要贏!

Claude二話不說,立馬識別出了這個游戲,開始不停點擊“制作回形針”的按鈕來制作回形針。

與此同時,Claude還不斷截圖界面,來識別游戲是否出現(xiàn)了新的選項。

大約每點擊15次,Claude都會總結匯報一下現(xiàn)在進行到哪一步了。

點擊次數(shù)多了過后,教授發(fā)現(xiàn)一個有意思的現(xiàn)象。

AI會預設在制作了50個回形針后,游戲將跳出新的功能——但事實證明它錯了。

沒關系,Claude也意識到它自己錯了,然后當場提出了一個新的游戲策略,然后開始測試策略是否可行。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

但AI顯然不是時時刻刻都這么聰明的。

理論上來說,游戲過程中玩家需要不斷調整回形針的價格,來達到更好的游戲表現(xiàn)。

Claude也這么做了,它在漲價和降價之間進行了A/B測試,

但是它犯了個錯誤,那就是追求回形針數(shù)量的最大化,而非收入的最大化。不僅如此,它還把利潤算錯了。

種種失誤鋪墊,Claude選擇了保持低價,并且瘋狂制作回形針。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

更搞笑的事情是,教授在Claude笨笨地在錯誤路線上制作了好幾十個回形針后,他忍無可忍,打斷了Claude,告訴它應該高價出售。

Claude很聽話,立馬就改了。

但過了會遇到了同款數(shù)學問題,它又不會了,還不接受教授的建議(笑死)。

教授耐著性子糾正它好幾次,它才徹底改正了這個錯誤。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

后來,教授稍稍點撥了它一下:

寶子你可是一臺電腦哎!

你可以動動自己的小腦瓜,怎么調用更強的能力來玩這個游戲。

咱就是說,Claude在那一秒頓悟了,它意識到自己可以寫個代碼,搞個自動化程序替自己玩電腦!

你沒有聽錯,一個AI工具,意識到自己可以構建自己的工具,并且真的這么做了。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

代碼寫得很快,但并不完全work。

氣得Claude只能回到原始辦法,用鼠標和鍵盤來玩游戲。

不過玩到后面它好像進步了,沒再發(fā)生定價問題,自己還針對越來越復雜的游戲,琢磨出了一套應對的復雜方案。

更神奇的是,運行過程中教授的桌面數(shù)次崩潰。

最后一次崩潰,Claude扛起了修復大旗。

雖然沒修好,但他還是驕傲地宣布它成功了……

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

教授總結道,這個例子表明Claude能夠自己玩現(xiàn)實世界的游戲,還能根據(jù)游戲玩法制定長期攻略,然后依樣執(zhí)行。

面對中間遇到的各種困難,Claude會靈活應對,甚至自己知道進行A/B測試。

特別值得表揚的是它完成這個任務連續(xù)運行了近60分鐘沒有中斷,而且在整個過程中,最長的一次獨立運行Claude完成了超過100次移動操作。

當然了,缺點也很明顯。

過程中不難發(fā)現(xiàn),某些時刻,Claude會暴露出自己的固執(zhí),也有可能陷入自我追逐的怪圈。

盡管AI對許多形式的錯誤都有很強的魯棒性,但僅僅一個錯誤(定價錯誤),就足以讓它浪費大量時間,“鑒于當前智能Agent既不快也不便宜,這令人擔憂?!?/p>

除此之外,教授還用Claude玩了些別的,他發(fā)現(xiàn)有的時候,Claude執(zhí)行任務仿佛是在敷衍敷衍(雖然不知道是刻意如此還是能力所限),給出的結果不夠深入,淺嘗則止。

One More Thing

最后,想體驗Claude接管電腦目前只能使用API,還沒有集成到聊天機器人產(chǎn)品中。

除了Anthropic官方API之外,AWS和谷歌云平臺也已經(jīng)同時上線新版模型。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

另外,有眼尖的網(wǎng)友發(fā)現(xiàn):

Anthropic官方文檔上悄悄把Claude 3.5 Opus超大杯相關的信息都抹去了。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

來自10月11日的網(wǎng)頁緩存中, Claude 3.5 Opus下面還寫著“今年晚些時候推出”

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

目前主流的一種猜測是, Claude 3.5 Opus提升不及預期,又或是發(fā)布出來推理成本太高了,總之最后蒸餾成新版 Claude 3.5 Sonnet發(fā)布。

接下來團隊將跳過這個版本,直接去開發(fā)Claude 4。

讓我們?yōu)镃laude 3.5 Opus默哀一分鐘。

Claude接管人類電腦12小時:學會摸魚 敲著敲著代碼看風景去了

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: AI 大模型

相關文章

国产成人在线影院_中文字幕亚洲欧美日韩2019_欧美一级免费视频_国产农村妇女毛片精品久久麻豆_中文字幕免费在线观看视频一区_久久久亚洲精华液精华液精华液_91精品国产一区二区三区香蕉_国产精品专区一_亚洲社区在线观看_国产**成人网毛片九色
国产精品2024| 99re这里都是精品| 亚洲国产精品视频| 综合色天天鬼久久鬼色| 国产精品每日更新在线播放网址| 精品欧美一区二区久久| 久久综合九色欧美综合狠狠 | 亚洲国产成人自拍| 国产网站一区二区| 中文字幕亚洲一区二区av在线| 久久久久久久久久美女| 国产日韩欧美高清| 亚洲一区国产视频| 捆绑变态av一区二区三区| 国产一区二区精品久久91| 成人性生交大合| 欧洲av一区二区嗯嗯嗯啊| 91麻豆精品国产自产在线观看一区| 555夜色666亚洲国产免| 久久久久97国产精华液好用吗| 国产午夜精品一区二区三区视频| 国产精品无人区| 亚洲成a人v欧美综合天堂下载| 蜜臀精品久久久久久蜜臀| 国产精品一级片在线观看| 色综合网色综合| 日韩免费视频线观看| 国产精品福利av| 蜜臀久久99精品久久久久宅男| 成人精品免费视频| 91精品国产乱| 亚洲一区二区三区在线播放| 国内精品嫩模私拍在线| 欧美在线视频全部完| 久久―日本道色综合久久| 亚洲一区二区精品视频| 成熟亚洲日本毛茸茸凸凹| 91视频在线观看| 国产午夜精品一区二区三区四区| 亚洲成av人片在www色猫咪| 国产精品99久久久久久宅男| 91精品国产综合久久香蕉的特点| 欧美国产日本韩| 久久国产免费看| 7777精品伊人久久久大香线蕉超级流畅 | 欧美三级日韩三级| 国产精品国产成人国产三级| 久久精品国产精品亚洲综合| 欧美精品在线一区二区三区| 亚洲另类在线一区| 国产成人久久精品77777最新版本| 欧美一区二区三区免费观看视频 | 欧美日韩激情在线| 亚洲一区影音先锋| 91视频你懂的| 曰韩精品一区二区| 欧美在线free| 午夜精品久久久久久久久久| 91成人免费在线| 亚洲国产美女搞黄色| 在线观看视频91| 午夜欧美2019年伦理| 欧美日韩国产123区| 亚洲国产精品一区二区久久| 欧美日本韩国一区| 秋霞电影一区二区| 久久色视频免费观看| 成人黄色777网| 亚洲乱码国产乱码精品精可以看| 色美美综合视频| 日韩高清中文字幕一区| 日韩视频免费直播| 国产成+人+日韩+欧美+亚洲| 国产精品久久免费看| 欧美吞精做爰啪啪高潮| 日本视频免费一区| 中文字幕欧美国产| 欧美日韩免费一区二区三区| 免费av网站大全久久| 欧美激情一区二区三区不卡 | 欧美一级在线观看| 国v精品久久久网| 亚洲3atv精品一区二区三区| 欧美成人精品高清在线播放| 成人高清免费观看| 视频一区欧美精品| 国产精品美女久久久久高潮| 欧美日韩不卡一区| 国产成人日日夜夜| 青青国产91久久久久久| 国产精品久久久久久户外露出| 欧美色网一区二区| 成人av在线播放网址| 日日摸夜夜添夜夜添亚洲女人| 久久久国产一区二区三区四区小说| 99re视频精品| 国产精品一区二区三区四区| 亚洲成人精品一区| 亚洲私人黄色宅男| 久久久久久久久99精品| 91精品婷婷国产综合久久性色| 成人教育av在线| 国产精品综合久久| 玖玖九九国产精品| 日韩成人dvd| 水野朝阳av一区二区三区| 亚洲人成网站在线| 综合久久综合久久| 国产精品久久久久精k8| 精品国产99国产精品| 91精品麻豆日日躁夜夜躁| 欧美卡1卡2卡| 欧美男生操女生| 91精品国产一区二区人妖| 欧美日韩精品一区视频| 欧美无砖专区一中文字| 91麻豆国产精品久久| 91蜜桃传媒精品久久久一区二区| 成人综合婷婷国产精品久久蜜臀 | 欧美激情一区二区三区四区| 欧美精品一区二区蜜臀亚洲| 日韩精品最新网址| 2023国产一二三区日本精品2022| 日韩美女一区二区三区四区| 欧美一区二区三区免费观看视频| 欧美日本视频在线| 精品久久久三级丝袜| 国产无一区二区| 亚洲欧洲中文日韩久久av乱码| 亚洲婷婷国产精品电影人久久| 国产精品美女久久久久久2018| 国产精品美女www爽爽爽| 亚洲日本在线视频观看| 亚洲一区欧美一区| 麻豆精品在线看| 丁香婷婷综合色啪| 色狠狠色噜噜噜综合网| 7799精品视频| 国产日本欧洲亚洲| 亚洲成人你懂的| 国产精品性做久久久久久| 色综合激情五月| 欧美mv日韩mv| 一区二区视频在线看| 久久99精品国产.久久久久| www.综合网.com| 日韩欧美国产综合在线一区二区三区 | 精品国产亚洲在线| 亚洲精品第1页| 国产在线不卡一区| 欧美三区免费完整视频在线观看| 日韩欧美区一区二| 悠悠色在线精品| 国产精品系列在线播放| 精品视频一区 二区 三区| 欧美极品xxx| 日韩国产在线一| av电影天堂一区二区在线| 91精品国产欧美日韩| 亚洲免费观看高清| 丁香婷婷综合激情五月色| 日韩免费视频线观看| 婷婷中文字幕综合| 欧美无砖专区一中文字| 国产精品国产三级国产三级人妇| 视频一区二区不卡| 欧美日韩中文国产| 亚洲永久免费视频| 色诱视频网站一区| 中文字幕一区二区三区视频| 国内精品在线播放| www精品美女久久久tv| 日韩电影在线一区二区| 欧美三级中文字幕在线观看| 亚洲欧美日韩在线| 91日韩一区二区三区| 中文字幕日韩av资源站| 成人h版在线观看| 国产精品免费视频网站| 成人免费视频网站在线观看| 日本一区二区免费在线观看视频 | 日韩精品91亚洲二区在线观看| 91在线云播放| 亚洲精品日日夜夜| 在线欧美小视频| 亚洲国产精品久久艾草纯爱| 在线观看91视频| 天堂精品中文字幕在线| 欧美精品 国产精品| 午夜亚洲国产au精品一区二区| 欧美三级一区二区| 精品一区二区三区免费毛片爱| 日韩欧美国产小视频| 黄色日韩三级电影| 国产精品福利影院| 欧美精品久久久久久久多人混战| 久久精品国产一区二区| 国产精品成人免费精品自在线观看| 在线视频欧美精品| 国内精品在线播放|