Analisis Perbandingan Berbasis Task-Oriented Evaluation Pada ChatGPT-4 dan Gemini (2.5 Flash)

Axel Theo Winata Ursia; Eric Jonathan; Anak  Agung Ugrasena

Authors

Axel Theo Winata Ursia Universitas Multi Data Palembang Author
Eric Jonathan Universitas Multi Data Palembang Author
Anak Agung Ugrasena Universitas Multi Data Palembang Author

Keywords:

ChatGPT-4, Gemini 2.5 Flash, Evaluasi Berbasis Tugas, Kecerdasan Buatan Generatif, Perbandingan AI, Pemrosesan Bahasa Alami

Abstract

Penelitian ini bertujuan untuk membandingkan performa dua model kecerdasan buatan generatif terkemuka, ChatGPT-4 dan Gemini 2.5 Flash, melalui pendekatan Task-Oriented Evaluation. Evaluasi dilakukan berdasarkan respons keduanya terhadap tiga skenario tugas umum, yaitu: penyelesaian masalah teknis, penjelasan konsep ekonomi (inflasi), dan penyusunan kerangka esai. Data dikumpulkan dari lebih dari 100 partisipan yang memberikan penilaian terhadap kejelasan, kelengkapan, serta kemudahan pemahaman tiap respons. Hasil analisis menunjukkan bahwa kedua model AI memiliki keunggulan masing-masing: ChatGPT-4 lebih unggul dalam penyampaian yang terstruktur dan ringkas, sementara Gemini 2.5 Flash menonjol dalam penyampaian yang naratif dan mendalam. Secara keseluruhan, mayoritas responden menilai kedua AI sama baiknya dalam menyelesaikan tugas, dengan preferensi terhadap model tertentu tergantung pada konteks dan gaya penyampaian yang diharapkan. Studi ini menegaskan pentingnya evaluasi berbasis tugas dalam menilai efektivitas AI generatif dalam konteks penggunaan nyata.

Author Biographies

Eric Jonathan, Universitas Multi Data Palembang

Saya Merupakan Mahasiswa di Program Studi Sistem Informasi, Fakultas ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang
Anak Agung Ugrasena, Universitas Multi Data Palembang

Saya merupakan mahasiswa di Program Studi Sistem Informasi, Fakultas Ilmu Komputer dan Rekayasa, Universitas Multi Data Palembang

Analisis Perbandingan Berbasis Task-Oriented Evaluation Pada ChatGPT-4 dan Gemini (2.5 Flash)

Authors

Keywords:

Abstract

Author Biographies

Downloads

Published

Issue

Section

License

Information

Language

Tamplate

Scholar

INCONITBis: Prosiding International Conference Information Technology and Business