ChatGPT vs Gemini Deep Research: Który agent AI jest lepszy?

4 miesięcy temu

Zdjęcie: ChatGPT

Openai i Google są w tej chwili zamknięte w wyścigu, aby zaoferować najlepszego agenta głębokiego badania. Głębokie agent badawczy Gemini jest zasilany nowym modelem myślenia Flash Gemini 2.0, podczas gdy agent badawczy CHATGPT wykorzystuje dopracowaną wersję modelu O3. Interesujące jest to, iż Google oferuje swojemu agentowi za darmo, a OpenAI opłaty 20 USD. Niemniej jednak przetestowaliśmy zarówno agentów badawczych Google, jak i Openai, więc sprawdźmy, jak się układają.

Zadanie nr 1: Badania nad pojawieniem się Chin w sztucznej inteligencji

Aby przetestować głębokiego agenta badawczego w Chatgpt i Gemini, poprosiłem ich o przeprowadzenie dogłębnych badań nad pojawieniem się Chin w dziedzinie AI. Poprosiłem obu agentów o analizę wiodących firm AI w Chinach, jakie są polityki rządowe, konkurencja z amerykańskimi laboratoriami i nie tylko.

Agent Chatgpt Deep Research zajął 10 minut na wykonanie zadania i zacytował 30 różnych źródeł, co spowodowało raport 9 000 słów. Z drugiej strony, głęboki agent badawczy Gemini badał przez 8 minut i wygenerował znacznie mniejszy raport 3000 słów. Jednak przeanalizowano ponad 170 stron internetowych, co jest niesamowite.

Jeśli chodzi o produkcję badań, dokładnie przejrzałem oba raporty i odkryłem Głębokie agent badawczy Chatgpt całkowicie nie powiódł Wspomnienie o ostatnich postępach AI w Chinach. Nie wspomniało choćby o Deepseek R1, nowym modelu Ernie 4.5 Baidu i nie tylko.

Jak się okazuje, głębokie agent badawczy CHATGPT polegał w dużej mierze na artykule Stanforda i stronie Wikipedii, które zostały opublikowane i ostatnio zaktualizowane odpowiednio w 2017 r. I 2021 r. W rezultacie większość informacji była przestarzała. Nie dotknął choćby najnowszych modeli generowania wideo i firm robotycznych.

Głębokie agent badawczy Gemini, choć zwięzły, wspomniał: „W szczególności Deepseek, startup założony w 2023 r., gwałtownie zyskał na znaczeniu dzięki swojemu modelowi R1”. Ponadto Gemini napisał również: „Deepseek wyróżniał się także swoją pionierską pracą w rozwijaniu nowych postępów architektonicznych, takich jak utajona uwaga (MLA)”.

Omówiono także narzędzia AI generacji wideo, takie jak KLING AI, Minimax i firmy robotyczne napędzane przez AI, takie jak UnitRee. Moja ocena jest taka Zaletą Gemini jest indeks wyszukiwania Googlektóry jest regularnie aktualizowany o nowe strony internetowe na każdy temat. Openai prawdopodobnie polega na tym, iż Bing w celu wyselekcjonowania stron internetowych do prac badawczych, w wyniku czego kursuje stare informacje.

Zadanie nr 2: Badania przyszłości układów AI nad Nvidia GPUS

W następnym zadaniu poprosiłem głębokiego agenta badawczego w Chatgpt i Gemini o zbadanie przyszłości specjalistycznych układów AI nad GPU NVIDIA, które są w tej chwili zatrudnione do szkolenia i nie tylko. Chatgpt obejmował 22 źródła i wygenerował duży dokument z tabelami i cytatami w linii. Gemini, tak jak wcześniej, przeanalizowało ponad 100 stron internetowych, ale stworzył krótki dokument.

Obaj agenci wspominali o powstaniu TPU, ASICS, FPGA, LPU i WSES i zgłosili fosę CUDA NVIDIA. Omówili nowe firmy krzemowe, takie jak Groq, Cerebry, Sambanova, Graphcore i inne. Agent AI głębokich badań Chatgpt poruszył także Ascend AI Chip Huawei, którego Bliźnięta przegapili.

Chatgpt Deep Research wspomniało także o chipach Amazon’s Trainium i Inceluction, Microsoft Maia Chip, Intel Gaudi Accelerator i Google TPU. Jednak, podobnie jak poprzedni fumble, Chatgpt utknął w przeszłości. Na przykład nie ma informacji, iż Google wydał już układ TPU V6E (Trillium). Następnie Chatgpt uważa, iż Blackwell B200 Nvidia jest nadchodzącym procesorem graficznym, ale został wydany w 2024 roku.

Pomimo jego braków oddałbym go do głębokiego agenta badawczego Chatgpt, ponieważ raport ma większą głębokość i spostrzeżenia niż Gemini. To powiedziawszy, należy zauważyć, iż istnieje fundamentalny problem z głębokim agentem badawczym Chatgpt.

Agent jest zasilany dopracowaną wersją modelu O3 Openai, który ma datę odcięcia szkolenia w październiku 2023 r. W rezultacie model wewnętrzny nie ma najnowszej wiedzy. Pomimo korzystania z Internetu w celu aktualnych informacji, często pomija najnowsze postępy.

Zadanie nr 3: Badania nad zarządzaniem otyłością w 2025 r.

W trzecim zadaniu poprosiłem głębokiego agenta badawczego w Chatgpt i Gemini o badanie zarządzania otyłością w 2025 r. W szczególności poprosiłem obu agentów o uwzględnienie najnowszych osiągnięć w 2025 r., Obejmując wszelkiego rodzaju terapie. Głębokie badania Chatgpt podały wysokiej jakości źródła i czasopisma medyczne, aby wyjaśnić obecną terapię w zarządzaniu otyłością.

Wspomniało o nowych przełomach, takich jak peptydy GLP-1, ich skutki uboczne, status zatwierdzenia przez FDA nowych leków, a choćby terapię genową. Ogólnie rzecz biorąc, Chatgpt podkreślił obecną politykę zarządzania otyłością USA, Wielkiej Brytanii i Kanady.

Z drugiej strony agent badawczy Gemini również wykonał wspaniałą robotę. Wymieniał wszystkie interwencje medyczne i zawierało Nadchodzące badania narkotykowe W formacie tabelarycznym. Ciekawe, iż Gemini wspomniał o nowych lekach, takich jak potrójny receptor hormonalny (retatrutyd), co powoduje szum w dziedzinie medycyny dla znacznej utraty wagi.

Ponadto Googlr’d Gemini zanurkował głęboko w firmy takie jak Novo Nordisk i Eli Lilly, które eksperymentują z nowymi lekami do zmniejszenia masy ciała, co daje pełny obraz rozwoju. Podsumowując, powiedziałbym, iż wygenerowany raport Gemini był dobrze zorganizowany i zawierał najnowsze informacje na temat zarządzania otyłością.

Czy powinieneś korzystać z głębokich badań chatgpt lub głębokich badań?

W moich testach wolałem głębokie badania AI Gemini, ponieważ konsekwentnie zawierał aktualne informacje na różne tematy. Podczas gdy głęboki agent badawczy CHATGPT obejmuje szeroki zakres pomysłów, jego ograniczona wiedza na temat najnowszego rozwoju utrudnia jej pełny obraz. Ponadto agent AI głębokich badań Gemini jest bezpłatny dla wszystkich użytkowników, podczas gdy OpenAI pobiera 20 USD za dostęp do swojego agenta.

Powodem, dla którego Gemini stał się tak lepszy, jest to, iż jest teraz zasilany przez model myślenia Flash Gemini 2.0. W porównaniu z poprzednim modelem Gemini 1.5 Pro, nowy model rozumowania myśli i planuje, jakie informacje potrzebują, aby ukończyć prace badawcze.

To powiedziawszy, jedną wielką zaletą głębokiego agenta badawczego Chatgpt jest to, iż możesz przesyłać pliki, podczas gdy Gemini nie zezwala na przesyłanie plików podczas korzystania z jego agenta. Może to być szczególnie pomocne w pracach badawczych związanych z STEM, w których można przesłać pliki PDF z wypłaty czasopism naukowych.

Ponieważ wiele z tych czasopism znajduje się za wypłatą i niedostępne za pośrednictwem wyszukiwania internetowego, możesz manualnie przesyłać pliki, aby zapewnić bogatszą bazę wiedzy. Umożliwi to agentowi włączenie cennych spostrzeżeń. Jednak Gemini pozwala eksportować wygenerowany raport do Google Docs, co jest pomocne w udostępnianiu.

Podsumowując, sugeruję skorzystanie z głębokiego agenta AI Gemini przed subskrybowaniem planu Chatgpt Plus. Google znacznie poprawił agenta i jest teraz znacznie szybszy.

Idź do oryginalnego materiału