GPT-5: 4 Fitur Baru yang Ingin Kami Lihat

GPT-5: 4 Fitur Baru yang Ingin Kami Lihat

tautan langsung

GPT-4 OpenAI saat ini merupakan alat AI generatif terbaik di pasar, namun bukan berarti kami tidak menatap masa depan. Dengan CEO OpenAI Sam Altman yang secara rutin memberikan petunjuk tentang GPT-5, sepertinya kita akan melihat model AI baru yang ditingkatkan dalam waktu dekat.





Video MUO hari ini GULIR UNTUK MELANJUTKAN ISI

Setidaknya, itulah yang kami harapkan. Tidak ada tanggal peluncuran spesifik untuk GPT-5, dan sebagian besar informasi yang kami ketahui berasal dari pengumpulan informasi lain dan upaya menghubungkan titik-titik tersebut.





Namun, berapa pun tanggal jatuh temponya, ada beberapa fitur utama yang ingin kami lihat saat GPT-5 diluncurkan.





cara menghapus baris di word

Apa itu GPT-5 OpenAI?

GPT-5 adalah penerus model AI GPT-4 OpenAI yang sangat dinantikan, dan secara luas diharapkan menjadi model generatif paling kuat di pasar. Meskipun saat ini belum ada tanggal rilis resmi untuk GPT-5, terdapat indikasi bahwa model tersebut mungkin akan dirilis pada awal musim panas 2024. Sangat sedikit detail yang diketahui tentang model tersebut saat ini, namun ada beberapa hal yang dapat dikatakan dengan sejumlah informasi. kepastian:

  • OpenAI telah mengajukan merek dagang untuk nama tersebut dengan Kantor Paten dan Merek Dagang Amerika Serikat .
  • Beberapa eksekutif OpenAI telah mendiskusikan atau mengisyaratkan kemungkinan kemampuan model tersebut.
  • CEO OpenAI Sam Altman berulang kali menyebutkan model tersebut pada bulan Maret 2024 Wawancara YouTube dengan Lex Fridman.

Semua ini menunjukkan satu kenyataan menarik: GPT-5 akan segera hadir! Meski begitu, banyak hal yang masih berupa spekulasi saat ini. Namun ada beberapa hal yang kami harap dapat dilihat dan kami cukup yakin dapat melihatnya dalam model tersebut. Berikut beberapa di antaranya:



1. Lebih Banyak Multimodalitas

  Generator teks-ke-video OpenAI Sora

Salah satu peningkatan paling menarik pada model AI keluarga GPT adalah multimodalitas. Untuk lebih jelasnya, multimodalitas adalah kemampuan model AI untuk memproses lebih dari sekadar teks tetapi juga jenis masukan lain seperti gambar, audio, dan video. Multimodalitas akan menjadi tolok ukur kemajuan penting bagi rangkaian model GPT di masa depan.

Karena GPT-4 sudah mahir dalam menangani input dan output gambar, peningkatan yang mencakup pemrosesan audio dan video adalah pencapaian berikutnya bagi OpenAI, dan GPT-5 adalah awal yang baik. Google sudah membuat kemajuan serius dalam multimodalitas semacam ini dengan model AI Gemini-nya. Merupakan hal yang tidak biasa bagi OpenAI untuk tidak merespons. Tapi, tentu saja, jangan percaya begitu saja. Di miliknya Podcast Hilangkan Kebingungan Saya [Transkrip PDF], Bill Gates bertanya kepada CEO OpenAI Sam Altman pencapaian apa yang dia ramalkan untuk seri GPT dalam dua tahun ke depan. Jawaban pertamanya? Pemrosesan Video.





Jadi, untuk GPT-5, kami berharap dapat bermain-main dengan video—mengupload video sesuai perintah, membuat video saat bepergian, mengedit video dengan perintah teks, mengekstrak segmen dari video, dan menemukan adegan tertentu dari file video besar. Kami berharap dapat melakukan hal serupa pada file audio. Itu pertanyaan besar, ya. Namun mengingat betapa cepatnya perkembangan AI, ekspektasi tersebut sangat masuk akal.

2. Jendela Konteks Lebih Besar dan Efisien

  Pantau di meja dengan logo OpenAI
Ralf Jhetner Borja/ film

Meskipun merupakan salah satu model AI tercanggih di pasar, rangkaian model AI GPT memiliki salah satu jendela konteks terkecil. Contohnya, Claude 3 dari Anthropic menawarkan jendela konteks 200.000 token , ketika Gemini dari Google dapat memproses 1 juta token (128.000 untuk pemakaian standar). Sebaliknya, GPT-4 memiliki jendela konteks yang relatif lebih kecil yaitu 128.000 token, dengan sekitar 32.000 token atau lebih sedikit yang tersedia secara realistis untuk digunakan pada antarmuka seperti ChatGPT.





Dengan hadirnya multimodalitas yang canggih, jendela konteks yang lebih baik hampir tidak bisa dihindari. Mungkin peningkatan dua atau empat kali lipat sudah cukup, tapi kami berharap bisa mencapai sepuluh kali lipat. Hal ini akan memungkinkan GPT-5 memproses lebih banyak informasi dengan cara yang jauh lebih efisien. Sekarang, jendela konteks yang lebih besar tidak selalu berarti lebih baik. Jadi, daripada hanya menambah jendela konteks, kami ingin melihat peningkatan efisiensi pemrosesan konteks.

Anda tahu, sebuah model mungkin memiliki jendela konteks satu juta token (kapasitas sekitar 700.000 kata) namun gagal menghasilkan ringkasan komprehensif ketika diminta untuk meringkas buku berisi 500.000 kata karena model tersebut tidak dapat memproses keseluruhan konteks secara memadai meskipun memiliki kemampuan untuk melakukannya secara teori. Bahwa Anda bisa membaca buku berisi 500 ribu kata tidak berarti Anda bisa mengingat semua isinya atau memprosesnya dengan bijaksana.

3. Agen GPT

  ChatGPT diakses di smartphone
Koshiro K/ stok foto

Mungkin salah satu kemungkinan paling menarik dari rilis GPT-5 adalah debut Agen GPT. Meskipun istilah 'pengubah permainan' mungkin telah digunakan secara berlebihan dalam AI, agen GPT benar-benar dapat mengubah permainan dalam segala hal. Namun seberapa besar perubahan yang terjadi?

Saat ini, model AI seperti GPT-4 dapat membantu Anda menyelesaikan tugas. Mereka dapat menulis email, melontarkan lelucon, memecahkan soal matematika, atau membuat draf postingan blog untuk Anda. Namun, mereka hanya dapat melakukan tugas tertentu dan tidak dapat menyelesaikan serangkaian tugas terkait yang diperlukan untuk menyelesaikan pekerjaan Anda.

Katakanlah Anda seorang pengembang web. Sebagai bagian dari pekerjaan Anda, Anda diharapkan melakukan banyak hal: mendesain, menulis kode, memecahkan masalah, dan banyak lagi. Saat ini, Anda hanya dapat mendelegasikan sebagian tugas tersebut ke model AI dalam satu waktu. Mungkin Anda dapat meminta model GPT-4 untuk menulis kode untuk halaman beranda, lalu memintanya untuk melakukannya untuk halaman kontak, lalu untuk halaman Tentang, dll. Anda harus menyelesaikan tugas ini secara berulang. Dan ada tugas yang tidak dapat diselesaikan oleh model.

Proses berulang dalam mendorong model AI untuk subtugas tertentu memakan waktu dan tidak efisien. Dalam skenario ini, Anda—pengembang web—adalah agen manusia yang bertanggung jawab untuk mengoordinasikan dan mendorong model AI satu tugas pada satu waktu hingga Anda menyelesaikan seluruh rangkaian tugas terkait.

Agen GPT menjanjikan bot ahli khusus yang dikoordinasikan oleh, semoga saja, GPT-5 yang mampu mendorong dirinya sendiri dan menangani semua subkumpulan tugas kompleks secara mandiri. Penekanan pada “self-prompting” dan “otonom.”

Jadi, jika GPT-5 dikirimkan bersama Agen GPT, Anda dapat memintanya untuk 'membuat situs portofolio untuk Maxwell Timothy' daripada hanya 'menuliskan kode untuk beranda kepada saya'. GPT-5 kemudian secara teoritis dapat melakukan self-prompt dengan menggunakan agen ahli AI untuk menangani berbagai subtugas yang diperlukan untuk membangun situs web. Ini mungkin memerlukan satu GPT untuk menghapus web untuk mendapatkan informasi tentang Maxwell Timothy, agen lain untuk menulis kode untuk halaman berbeda, agen lain untuk menghasilkan dan mengoptimalkan gambar, dan bahkan agen AI lain untuk menyebarkan situs, semuanya tanpa memerlukan manusia berulang kali. dorongan.

4. Mengurangi Halusinasi

Meskipun OpenAI telah mengalami banyak kemajuan dalam menangani halusinasi dalam model AI-nya, ujian sesungguhnya bagi GPT-5 adalah kemampuannya untuk mengatasi masalah halusinasi yang terus-menerus terjadi, yang telah menghambat adopsi AI secara luas dalam skala besar. domain yang sangat penting bagi keselamatan seperti layanan kesehatan, penerbangan, dan keamanan siber. Ini semua adalah bidang-bidang yang akan mendapat manfaat besar dari keterlibatan AI yang besar, namun saat ini menghindari adopsi yang signifikan.

Untuk lebih jelasnya, halusinasi dalam konteks ini mengacu pada situasi di mana model AI menghasilkan dan menyajikan informasi yang terdengar masuk akal namun sepenuhnya dibuat-buat dengan tingkat kepercayaan yang tinggi.

Bayangkan sebuah skenario di mana GPT-4 diintegrasikan ke dalam sistem diagnostik untuk menganalisis gejala pasien dan laporan medis. Halusinasi dapat membuat AI dengan percaya diri memberikan diagnosis yang salah atau merekomendasikan pengobatan yang berpotensi berbahaya berdasarkan fakta yang dibayangkan dan logika yang salah. Konsekuensi dari kesalahan dalam bidang medis bisa menjadi bencana besar.

cara mendapatkan wallpaper video

Persyaratan serupa juga berlaku untuk bidang-bidang lain yang memiliki konsekuensi tinggi, seperti penerbangan, tenaga nuklir, operasi maritim, dan keamanan siber. Kami tidak berharap GPT-5 menyelesaikan masalah halusinasi sepenuhnya, namun kami berharap GPT-5 dapat mengurangi kemungkinan terjadinya insiden tersebut secara signifikan.

Saat kita menantikan peluncuran resmi model AI yang sangat dinanti ini, satu hal yang pasti: GPT-5 memiliki potensi untuk mendefinisikan kembali batasan-batasan dari apa yang mungkin dilakukan dengan kecerdasan buatan, sehingga mengantarkan era baru kolaborasi dan inovasi manusia-mesin.