
Ak ste už počuli o BrowserOS a premýšľali ste, prečo toľko ľudí hovorí o „prehliadači s mozgom“, tu je kompletný obraz. BrowserOS je prehliadač s otvoreným zdrojovým kódom, ktorý obsahuje agentov umelej inteligencie schopných porozumieť a vykonávať inštrukcie v prirodzenom jazyku.Klikanie, písanie a prehliadanie vo vašom mene, s využitím vašich prihlásených relácií a lokálneho prístupu. To všetko s prístupom založeným na predvolenom súkromí a bez spoliehania sa na cloudovú infraštruktúru pre vaše osobné údaje.
Tento návrh nie je len ďalším náhodným nápadom vo svete prehliadačov: BrowserOS vznikol ako fork prehliadača Chromium s kompatibilitou s rozšíreniami prehliadača Chrome a jasným cieľom.byť otvorenou a na súkromie zameranou alternatívou k riešeniam, ako sú Atlas (ChatGPT)Comet (Perplexity) alebo Dia, okrem tradičných prehliadačov. Myšlienka sa dá jednoducho vysvetliť a jej účinok je silný: popíšete úlohu a agent ju vykoná z vášho počítača, s vašimi prihlasovacími údajmi a bez toho, aby vašu históriu posielal tretím stranám.
Čo je BrowserOS a v čom sa líši?
V podstate, BrowserOS je prehliadač, ktorý natívne spúšťa agentov umelej inteligencie.Umožňuje vám písať pokyny, akoby ste ich vysvetľovali kolegovi, a systém sa postará o vykonanie postupnosti akcií: otváranie stránok, spúšťanie vyhľadávaní, vypĺňanie formulárov alebo extrahovanie údajov. Nie je to externý asistent, ktorý sa „pozerá“ na váš prehliadač: agenti žijú v samotnom BrowserOS.
Pretože je postavený na prehliadači Chromium, zážitok sa zdá známy od prvej minútyZnáme rozhranie, kompatibilita s rozšíreniami, import údajov z prehliadača Chrome a prakticky okamžité prijatie pre tých, ktorí už ekosystém poznajú. Tento efekt „pocitov domova“ znižuje trenie pri začatí automatizácie bez obetovania každodenného používania.
Prečo práve teraz: čas na agentov v prehliadači
V posledných mesiacoch programovacie nástroje s podporou umelej inteligencie znásobili produktivitu vývojárov. Milióny pracovníkov so znalosťami však naďalej uviazli v opakujúcich sa úlohách prehliadača.Kopírovanie a vkladanie, vypĺňanie formulárov, export údajov z dashboardu, spúšťanie kampaní atď. Je to každodenná prekážka.
Tím BrowserOS naznačuje, že po prvýkrát od čias Netscape, Máme možnosť prepracovať prehliadač pre skutočnú prácuAk už umelá inteligencia „píše“ celé projekty, prečo nemôže stláčať tlačidlá, navigovať vo webovom rozhraní alebo spájať akcie tak, ako by ste to robili vy, ale bez toho, aby ste museli mať všetko neustále pod kontrolou?
Problémy, ktoré BrowserOS rieši
Pred BrowserOS zlyhávalo nasadenie agentov v úlohách v reálnom svete z veľmi špecifických dôvodov. Projekt identifikuje tri hlavné prekážky, ktoré bránili jeho masovému prijatiu.najmä vo firmách:
- Prístup k overeným reláciámMnohé riešenia pre agentov bežia na vzdialených počítačoch a nedokážu fungovať s vašimi skutočnými účtami (Gmail, LinkedIn, firemné nástroje). V dôsledku toho zlyhávajú v úlohách v reálnom svete.
- Fragmentácia nástrojaNiektorí agenti komunikujú so servermi MCP, iní vykonávajú iba webovú automatizáciu a ďalší reťazia API, ako napríklad Zapy. Chýba však jednotný „súbor nástrojov“ na vytváranie komplexných postupov.
- Čierna skrinka a zámokNiekoľko populárnych prehliadačov sú vyhľadávacie alebo reklamné produkty. Neotvárajú výzvy ani vnútorné fungovaniePriradia vám konkrétny LLM a smerujú dáta na svoje servery. Pre mnohé spoločnosti je to jednoznačné nie.
BrowserOS reaguje od základov: agenti vo vašom prehliadači, spustení na vašom počítačiKombináciou MCP a automatizácie a v rámci 100% otvorenej filozofie, ktorú umožňuje auditovať a forkovať kedykoľvek chcete, táto kombinácia rieši to, čo doteraz znemožňovalo delegovať serióznu prácu na umelú inteligenciu v prehliadači.
Ako funguje BrowserOS a prvé kroky
Tok je priamy: BrowserOS si stiahnete a nainštalujete rovnako ako akýkoľvek iný prehliadač.Prihlásite sa na stránky, ktoré denne používate, a odtiaľ popíšete úlohy v prirodzenom jazyku. Agent koná vo vašom reálnom kontexte, s vašimi povoleniami a aktívnymi reláciami, akoby ste boli pred obrazovkou.
- Stiahnutie a inštalácia BrowserOS pre váš systém (k dispozícii pre macOS, Windows a Linux). Ak máte obavy z inštalácie v systéme Linux, je k dispozícii ako AppImage. na GitHub.
- Importovať údaje z prehliadača Chrome ak máte záujem o uchovávanie záložiek, histórie alebo nastavení.
- Pripojte svojho poskytovateľa umelej inteligencie: OpenAIAntropické alebo lokálne modely cez Ollama/LM Studio s vašimi vlastnými kľúčmi.
- Začnite automatizovaťSformulujte ciele v texte a nechajte agenta vykonať kroky na webe.
Môžete tiež kombinovať automatizáciu prehliadača so servermi MCP a volania API v rovnakom postupe. Táto kombinácia vám umožňuje vytvoriť asistentov schopných získavať dáta, spracovávať ich v modeli a aktualizovať tabuľky alebo nástroje SaaS, a to všetko prepojené jedným agentom.
Kľúčové vlastnosti BrowserOS, ktoré robia rozdiel
- Stavebné agenty v prirodzenom jazykuHovorte si, čo chcete, bez programovania.
- Sloboda modelovPrineste si kľúče a prepínajte medzi LLM alebo spúšťajte lokálne modely.
- Je to „normálny“ prehliadačChrómová báza, Fungujú vaše rozšírenia pre Chrome?.
Súkromie je pilierom dizajnu: Vaše údaje, história a relácie zostávajú vo vašom počítači.Bez invazívnej telemetrie alebo závislosti od externých cloudov. Ak chcete, môžete pracovať výlučne s lokálnymi modelmi a úplne uzavrieť prívod vody.
A ak to nestačilo, Pracujú na blokovači reklám s umelou inteligenciou ...čo sľubuje pokrytie zložitejších scenárov ako statické filtre. A pre vývojárov a pokročilých používateľov je k dispozícii podpora pre používanie prehliadača ako MCP servera, integrácia s nástrojmi ako napríklad claude-code o gemini-cli.
Integrácie, MCP a použitie z externých nástrojov
Jednou z jeho najsilnejších stránok je, že BrowserOS môže fungovať ako MCP serverTo znamená, že iné aplikácie kompatibilné s protokolom (ako napríklad tie, ktoré sú spomenuté) claude-code o gemini-cliMôžu „komunikovať“ s vaším prehliadačom a delegovať úlohy webového rozhrania na svojich agentov.
Zaujímavá je orchestrácia: Nemusíte si vyberať medzi automatizáciou prehliadača alebo volaním API.V jednom recepte agenta môžete robiť oboje. Napríklad extrahovať dáta z portálu so zložitým používateľským rozhraním, spracovať ich pomocou modelu a potom načítať výsledok do tabuľky alebo CRM bez nutnosti manuálneho miešania nástrojov.
Rýchle porovnanie s Chrome, Brave, Arc/Dia a Perplexity Comet
V porovnaní s Chromeom
Vďaka otvorenému zdrojovému kódu prehliadača Chromium zdedil BrowserOS základy, ale Prehliadač Chrome už roky nepoužíval výrazné vylepšenia natívnej umelej inteligencie pre automatizáciu.Bez MCP, bez lokálnych agentov, bez integrovanej orchestračnej vrstvy zostáva len skvelým prehliadačom... bez „asistenta typu „klikni za teba“.
Tvárou v tvár statočným
Odvážny vydláždil cestu v súkromí, ale Ich zameranie je rozdelené medzi kryptomeny, vyhľadávanie, VPN a ďalšie.BrowserOS si robí svoje: umelá inteligencia v prehliadači a skutočná automatizácia práce.
Oblúk/priemer čelom
Mnoho ľudí ocenilo Arcov návrh, ale Zastavila svoj kód a nechala používateľov v limbu.V BrowserOS je to presne naopak: 100% otvorené, auditovateľné, forkovateľné, so zapojením komunity a bez závislosti od jediného poskytovateľa.
Kométa zmätenosti Tvárou v tvár
Perplexity je v konečnom dôsledku vyhľadávacia a reklamná spoločnosť. Vaša história sa môže stať produktomV systéme BrowserOS je sľub jasný: lokálne dáta a úplná kontrola z vašej strany.
Bezpečnosť, súkromie a licencovanie
Filozofia je „súkromie na prvom mieste“: Používate vlastné API kľúče alebo lokálne modely s Ollama/LM StudioVy si vyberiete, čo sa vo vašom zariadení uloží a čo nie, a históriu a relácie uchovávate mimo dosahu tretích strán.
Na právnej a komunitnej úrovni, BrowserOS je slobodný softvér licencovaný pod AGPL-3.0.Môžete vidieť, ako sa to robí, skontrolovať systémové výzvy, navrhnúť zmeny, rozvetviť projekt a prispieť. To všetko v duchu „vyrobené s láskou zo San Francisca“, o ktorom hovoria jeho tvorcovia.
Komunita, čísla a dynamika projektu
Záujem je hmatateľný. Môže sa pochváliť viac ako 4,3 tisíc hviezdičkami na GitHub, viac ako 25 000 stiahnutiami a komunitou Discord s viac ako tisíckou používateľov. ľudí aktívne sa zúčastňujúcich. V inom fragmente sa objavujú metriky ako „6,3 tis.“ a „558“ (súvisiace s repozitárom, pravdepodobne hviezdičky/sledovatelia/vetvy), čo naznačuje vzostupný trend.
Technicky projekt vyniká svojím základom C++ na vrchole giganta Chromia, čo je náročná cesta, ktorá si vyžaduje veľa tvrdej práce a udržiavanie kompatibility s predchádzajúcimi zmenami a zároveň pokračovanie v inováciách na agentovej vrstve.
Prípady použitia a ukážky
Zamyslite sa nad úlohami z reálneho sveta: Identifikujte profily, ktoré vás zaujímajú, medzi vašimi aplikáciami na LinkedIn a pridajte ich do tabuľky Google.Vyplňte dlhé formuláre, zhromažďujte údaje z viacerých webových stránok alebo si pripravte predbežný brífing s kľúčovými informáciami pre stretnutie. Popíšete to v texte a agent sa bude riadiť a koná rovnako ako vy.
K dispozícii je audiovizuálny materiál, ktorý ukazuje koncept v praxi: ukážky ako „HackerNews.top.3.mp4“, „use-browserOS-to-chat.mp4“ alebo „use-browserOS-to-extract.mp4“ Učia všetko od asistovaných rozhovorov až po extrakciu údajov v reálnych podmienkach, pričom zdôrazňujú, že automatizácia sa deje vo vašom autentickom kontexte.
Vízia: Prehliadač ako „operačný systém“ pre agentov
Firmy žijú v prehliadači: Salesforce, SAP, Workday, interné nástroje… Armáda pracovníkov so znalosťami trávi 60 – 80 % svojho dňa na webových aplikáciách.Ak agent dokáže klikať a písať ako človek, dokáže automatizovať prakticky akékoľvek rozhranie vrátane tých bez API.
Vízia, ktorú projekt predstavuje, je, že IT môže nasadiť opakovane použiteľných „zamestnaneckých agentov“„Agent pre výdavky“ spoločnosti, „agent pre reklamy na Facebooku“ zdieľaný komunitou, ktorého si prispôsobíte svojmu pracovnému postupu atď. Menej mechanických úloh, viac zamerania na to, čo prináša hodnotu.
Kto stojí za BrowserOS
Jadro projektu vedú dvaja bratia-dvojčatá so serióznymi skúsenosťami vo veľkých technologických firmách. Nikhil pracoval na backende Reels a Facebook feede pomocou C++ a systémov.Nithin bol inžinierom strojového učenia v YouTube a podieľal sa na prvom významnom modeli odporúčaní (LRM) platformy. Táto kombinácia nízky level a vrstva umelej inteligencie im dáva slobodu pracovať s prehliadačom Chromium a zároveň nad ním budovať „mozog agenta“.
- Skúsenosti s C++ a rozsiahlymi systémamiúdržba kritických a vysokovýkonných služieb.
- Špecializácia na strojové učenie a odporúčateľovhlboké pochopenie moderných modelov a ich nasadenia.
Hlasy z komunity a menej známe alternatívy
Medzi pokročilými používateľmi je záujem o „iné“ prehliadače s potenciálom. Boli testované alternatívy ako Wavebox, Ulaa, Arc, Ghost Browser alebo ThoriumPrehliadač Zen je chválený za svoju produktivitu (aj keď nie je založený na prehliadači Chromium). Tieto testy uvádzajú, že Wavebox je veľmi komplexný, ale môže byť ohromujúci a že jeho plné využitie je časovo náročné; Ulaa sa chváli súkromím, ale obsahuje príliš veľa doplnkov; Arc vyvolal zmiešané reakcie; a Ghost Browser si celkom nezískal priazeň všetkých.
Pokiaľ ide o tórium, počuli sme, že Je to veľmi rýchle, ale s určitými bezpečnostnými problémami.Preto to niektorí ľudia odkladajú. A často sa odporúča nekupovať tie najznámejšie, pretože už vyskúšali asi dvadsať a cieľom je objaviť rarity, ktoré ponúkajú niečo skutočne nové.
Stručný návod na používanie agentov
Keď ste vo vnútri, „magický moment“ nastáva, keď opisujete skutočné úlohy. Namiesto toho, aby agent požiadal o „hľadanie toho a toho“ a vrátil súhrn, vykoná interakciu vo vašom prehliadači.Ak webová stránka nemá API, nevadí: existuje používateľské rozhranie, existujú akcie, ktoré agent dokáže presne replikovať.
- Opíšte svoj cieľNapríklad vyhľadanie konkrétnych kontaktov v profesionálnej sieti a prenos ich informácií do tabuľky.
- Potvrďte kroky ak vám ich agent navrhne (užitočné na overenie toho, čo urobí).
- Dohliadajte prvýkrát Ak chcete upraviť výzvy alebo pravidlá, recept znova použite.
Použitie MCP a schopnosť „prepojiť“ automatizáciu, API a modely to umožňujú jeden agent rieši kompletné end-to-end procesy, čo predtým vyžadovalo zlepenie viacerých nástrojov lepiacou páskou.
Ochrana súkromia už v štádiu návrhu a kontrola modelu
Kľúčovou výhodou je sloboda výberu enginu umelej inteligencie. Môžete pracovať s OpenAI, Anthropic alebo všetko udržiavať lokálne s Ollama/LM Studio.Trasa sa upravuje na základe nákladov, latencie alebo citlivosti projektu. Tí, ktorí uprednostňujú absolútne súkromie, majú 100 % lokálnu trasu.
Okrem toho, Projekt publikuje a umožňuje úpravu systémových výziev.Toto je nezvyčajné. Táto transparentnosť uľahčuje prispôsobenie správania agenta vašej organizácii alebo konkrétnemu prípadu a audit jeho rozhodovania.
Kroky, ako prispieť k projektu BrowserOS
Ak veríte tejto myšlienke a chcete pomôcť, existuje niekoľko spôsobov, ako ju podporiť. Zanechajte hviezdičku na GitHube Pomáha to zvýšiť viditeľnosť; stiahnutie a používanie poskytuje zaujímavú telemetriu (ak ju aktivujete) a spätnú väzbu; a pripojenie sa k Discordu vám umožňuje navrhovať, objavovať a testovať nové funkcie.
Nakoniec, oficiálna webová stránka zvyčajne zobrazuje pripomienku stiahnite si prehliadač pre váš systémAk chcete, môžete importovať údaje z prehliadača Chrome a pripojiť sa k preferovanému poskytovateľovi umelej inteligencie. Potom už len stačí vytvoriť agentov a zdieľať, čo vám vyhovuje.
Pri pohľade na celkový obraz sa BrowserOS etabluje ako Prehliadač s otvoreným zdrojovým kódom, zameraný na agentov, uprednostňujúci súkromie, založený na prehliadači Chromium a s rastúcou komunitou.Kombinuje kompatibilitu s rozšíreniami, MCP, podporu lokálnych modelov (Ollama/LM Studio) a otvorený záväzok, ktorý zahŕňa licenciu AGPL-3.0 a upraviteľné výzvy. Na rozdiel od prehliadačov Chrome, Brave, Arc/Dia alebo iných ponúk založených na reklamách a vyhľadávaní sa zameriava na prinesenie „mágie“ umelej inteligencie priamo na miesto, kde každý deň pracujete. A hoci je ešte potrebné doladiť detaily (napríklad blokovač reklám s umelou inteligenciou, ktorý bude čoskoro k dispozícii, alebo občasné problémy s inštaláciou v systéme Windows), tempo a zapojenie používateľov poukazujú na projekt, ktorý rastie, s láskou budovaný v San Franciscu a s túžbou transformovať web z obyčajného reťazca kliknutí na konečne platformu pre agentov, ktorí s vami spolupracujú.