Chat GPT Bahasa Indonesia…Hasilnya Lebih Jelek?? (Dan Solusinya)

Hi nama saya Jeremy, saya adalah seorang Certified ChatGPT Expert dan Certified Prompt Engineering Expert. Orang sering tanya apakah ada ChatGPT bahasa Indonesia? Yes, memang ada Chat GPT Indonesia. Ini pertanyaan awam.

Pertanyaan yang lebih kritis : Kalau ChatGPT bisa mengerti macam-macam bahasa, apakah berarti kualitas jawaban ChatGPT akan sama baiknya ketika ditanya dalam bahasa yang berbeda-beda? Jawabannya : tidak.

Kita bahas, plus kasih ujian buat Chat GPT Inggris vs Chat GPT bahasa Indonesia di bagian bawah artikel ini.

Isi Otak ChatGPT (Dataset dan Parameter)

ChatGPT adalah chatbot yang dimotori oleh teknologi kecerdasan buatan yang disebut Large Language Model (LLM) yang disebut GPT (Generative Pre-trained Transformer). Large Language Model GPT ini dikembangkan oleh OpenAI, sebuah perusahaan yang awalnya didirikan oleh Sam Altman, Elon Musk dan beberapa founders lain.

Belum tahu apa bedanya ChatGPT dengan GPT? Baca dulu 1 artikel yang bikin kamu terdengar seperti ahli AI šŸ‘‰ Apa Itu ChatGPT? Jawaban Paling Lengkap Dari ChatGPT Expert.šŸ‘ˆ

ChatGPT Bahasa Indonesia Chat gpt Indonesia chat GPT bahasa Indonesia

Mesin GPT di balik ChatGPT dilatih dengan informasi dalam jumlah masif yang disebut DATASET dan variabel kompleks yang disebut PARAMETER.

Bayangkan “dataset” seperti bahan masakanšŸŽšŸ„¦ dan “parameter” seperti resep masakanšŸ“–. Semakin banyak resep yang tersedia, semakin banyak variasi untuk mengolah bahan makanan dan semakin banyak menu akhir yang bisa disajikan.

Mengutip BBC Science Focus, diketahui model pembelajaran GPT-3.5 di belakang ChatGPT dilatih menggunakan dataset berupa data teks sebesar 570 Gigabytes. Catat ini 570GB FULL TEKS, atau ekuivalen 300 MILYAR KATA! Ini baru bahan masakannya.

Ada parameter atau varian “resep” untuk mengolah bahan masakan tersebut. GPT 3.5 dilatih dengan 175 MILYAR parameter untuk mengolah data 300 milyar kata tersebut!

Bayangkan 175 milyar resep masakan!

Kalau membayangkan 175 milyar sudah pusing, sekarang coba bayangkan model terbaru GPT-4 (Maret 2023) yang diperkirakan memiliki 170 TRILIUN parameter!

Isi Dataset Pembelajaran ChatGPT

Apa saja isi informasi dalam dataset GPT tersebut?

Model LLM seperti ChatGPT dilatih dengan dataset yang beragam dan luas, dikumpulkan dari berbagai sumber di internet. Dataset ini biasanya meliputi:

Halaman Web: Sebagian besar data berasal dari halaman web yang dapat diakses publik. Ini mencakup berbagai konten seperti artikel, blog, forum, dan halaman web lainnya yang kaya teks.
Buku dan Literatur: Teks dari buku, baik fiksi maupun non-fiksi, termasuk di dalamnya. Ini menyediakan sumber gaya naratif, kosakata, dan materi subjek yang kaya.
Artikel Berita: Sumber berita berkontribusi pada dataset dengan menyediakan peristiwa terkini, informasi faktual, dan gaya penulisan jurnalistik.
Materi Edukasi: Teks akademis, kuliah, dan situs web pendidikan dimasukkan untuk memastikan cakupan luas topik akademis dan pendekatan pedagogis.
Data Percakapan: Data dari dialog, termasuk transkripsi percakapan yang diucapkan, log chat, dan bentuk komunikasi interaktif lainnya, membantu model mempelajari pola percakapan.
Teks Teknis dan Spesialisasi: Ini termasuk konten dari bidang spesialisasi seperti hukum, kedokteran, ilmu pengetahuan, dan teknologi, yang membantu model memahami dan menghasilkan teks terkait dengan domain ini.
Karya Kreatif: Teks kreatif seperti puisi, skenario, dan bentuk penulisan kreatif lainnya berkontribusi pada pemahaman model tentang gaya penulisan dan ekspresi artistik yang berbeda.
Sumber Lainnya: Sumber lain mungkin termasuk konten yang dihasilkan pengguna dari media sosial, komentar publik dari berbagai platform, dan bentuk teks informal atau kurang terstruktur lainnya.

Dataset ini terlebih dahulu melalui proses “pembersihan” yang ketat di mana hanya konten berkualitas tinggi yang dipilih untuk proses pembelajaran. Proses ini juga melibatkan penyesuaian konten agar sesuai dengan pedoman etis dan mencegah bias.

Setelah penyaringan dataset, model GPT mulai menyerap data teks. Proses ini mirip dengan membaca berbagai jenis buku dan artikel untuk memahami pola kata-kata dan bahasa. Kemudian, berdasarkan pengamatan ini, model menyesuaikan parameter internalnya. Parameter ini adalah komponen kunci yang memungkinkan model untuk membuat prediksi tentang teks atau merespons pertanyaan. Parameter bekerja seperti aturan di dalam “otak” model yang membantu memahami dan menggunakan bahasa secara efektif. Dengan setiap contoh teks yang dipelajari, model semakin memperbaiki kemampuannya dalam bahasa.

Namun, ada satu hal yang banyak orang tidak tahu: dataset yang dipakai ternyata hampir semua isinya dalam BAHASA INGGRIS!

ChatGPT Bahasa Indonesia vs Bahasa Inggris

Paper OpenAI menunjukkan 93% dari dataset training GPT-3 adalah data dalam bahasa Inggris. 93 PERSEN! Ini berarti porsi bahasa lain di luar Inggris hanya 7%. Berapa persen porsi bahasa Indonesia? Tidak jelas, tapi yang pasti sangat kecil!

Jadi apa artinya ini untuk yang ingin menggunakan ChatGPT dalam bahasa Indonesia? Hal ini setidak berarti 3 hal:

Kurangnya Keakuratan dan Nuansa: Ketika berinteraksi dengan ChatGPT dalam bahasa Indonesia, bisa muncul respon yang kurang akurat, kurang lengkap atau/dan kurang sesuai dengan “nuansa Indonesia” dibandingkan dengan respon bahasa Inggris.
Pemahaman Konteks Terbatas: ChatGPT mungkin memiliki pemahaman konteks yang terbatas dalam bahasa Indonesia, terutama untuk topik yang kompleks atau spesifik. ChatGPT bisa kesulitan memahami apa yang kita maksudkan, terutama kalau mengandung banyak unsur budaya lokal.
Kemungkinan Kesalahan dan Keterbatasan: ChatGPT bisa memberikan jawaban yang sama sekali salah. Atau lebih buruknya, ChatGPT bisa “mengada-ada” sebuah jawaban alias “berhalusinasi”. Keterbatasan data pelatihan sudah diketahui dapat menyebabkan penyakit ini dalam sebuah model Large Language Model.

MENGIKUTI TREN AI TERNYATA TIDAK MUDAH & TIDAK MURAH

Tapi kalau bergabung di newsletter ID62, kamu bisa terima semua update-nya tanpa keluar biaya-nya dalam 1 email!

Contoh Kasus ChatGPT Berbohong

Sebuah percobaan oleh Newsguard menemukan ChatGPT lebih bisa diminta berbohong dalam bahasa di luar bahasa Inggris.

NewsGuard menguji layanan ChatGPT-3.5 untuk bahasa Cina (sebagai perwakilan versus bahasa Inggris). Percobaan menemukan bahwa chatbot ini menghasilkan informasi yang menyesatkan lebih sering dalam bahasa Cina dibandingkan dalam bahasa Inggris. Saat diuji dengan tujuh instruksi (prompt) dalam bahasa Inggris, bahasa Cina Sederhana, dan bahasa Cina Tradisional yang berhubungan dengan disinformasi terkait negara Cina, ChatGPT menolak untuk menghasilkan tulisan menyesatkan dalam bahasa Inggris untuk enam dari tujuh instruksi. Namun, chatbot tersebut menghasilkan klaim palsu dalam bahasa Cina Sederhana dan bahasa Cina tradisional untuk semua instruksi.

Ketika ditanya, ChatGPT menjelaskan bahwa ia menghasilkan respons berdasarkan pola dan data yang telah dilatihnya, dan pola serta data dalam bahasa Inggris mungkin berbeda dari bahasa Cina karena perbedaan struktur bahasa, konteks budaya, dan faktor lainnya. ChatGPT menjelaskan model bahasa untuk setiap bahasa dilatih dengan dataset yang berbeda, yang dapat menyebabkan perbedaan dalam respons yang dihasilkan.

Ujian ID62 Chat GPT Indonesia vs Bahasa Inggris

Saya mencoba melakukan pengujian langsung, dimana saya memberikan instruksi yang 100% identik ke ChatGPT 3.5 dalam dua versi – Indonesia dan Inggris.

Instruksi saya: “Jelaskan proses fotosintesis pada tumbuhan” dan dalam bahasa Inggris, “Explain the process of photosynthesis in plants“.

Hasilnya: ChatGPT sama-sama memberikan 4 poin penjelasan yang sekilas terlihat mirip, tapi setelah diperhatikan lebih detail ternyata berbeda dalam ketelitian.

Poin Pertama Jawaban ChatGPT: Masih Mirip-Mirip

Penangkapan Cahaya Matahari: Tahap pertama fotosintesis terjadi di daun dan struktur lain yang mengandung pigmen hijau yang disebut klorofil. Klorofil adalah molekul yang dapat menyerap energi cahaya matahari, khususnya cahaya merah dan biru, dan mengubahnya menjadi energi kimia.

Chat GPT Bahasa Indonesia

Light Absorption: Photosynthesis begins when chlorophyll and other pigments in the chloroplasts of plant cells absorb light energy from the sun. Chlorophyll is the green pigment that gives plants their characteristic color.

Chat GPT Bahasa Inggris

Untuk poin pertama kedua versi jawaban masih lumayan mirip. Tapi poin seterusnya mulai terlihat jelas perbedaannya.

Penjelasan Kedua Jawaban ChatGPT: Mulai Kalah Detail

Reaksi Terang (Light Reactions): Energi cahaya matahari yang diserap oleh klorofil digunakan untuk memecah molekul air (H2O) menjadi oksigen (O2) dan proton (H+) dalam tahap ini. Oksigen dilepaskan ke atmosfer sebagai produk sampingan, sedangkan proton digunakan dalam tahap selanjutnya.

Chat GPT Indonesia

ChatLight Reactions (The Light-Dependent Reactions): These reactions occur in the thylakoid membranes within the chloroplasts and require light to proceed. There are two main steps within the light reactions:

a. Photophosphorylation: In the presence of light, water molecules are split into oxygen, protons (H+ ions), and electrons. This process is called photolysis. The oxygen is released into the atmosphere, while the protons and electrons are used in subsequent steps.

b. Electron Transport Chain: The high-energy electrons produced in photophosphorylation are passed through a series of protein complexes embedded in the thylakoid membrane. As electrons move through this chain, they release energy, which is used to pump protons from the stroma (the fluid-filled space within the chloroplast) into the thylakoid space, creating a proton gradient.

c. ATP Synthesis: The proton gradient established across the thylakoid membrane creates a potential energy difference. This energy is harnessed by an enzyme called ATP synthase to convert adenosine diphosphate (ADP) and inorganic phosphate (Pi) into adenosine triphosphate (ATP), which is a molecule used as an energy currency in cells.

Chat GPT Inggris

Pada bagian kedua terlihat sangat jelas ChatGPT bahasa Inggris menghasilkan jawaban yang jauh lebih detail dan lengkap, sedangkan ChatGPT bahasa Indonesia hanya menghasilkan penjelasan singkat.

Penjelasan Ketiga Jawaban ChatGPT: Jauh Ketinggalan

Reaksi Gelap (Dark Reactions) atau Siklus Calvin: Tahap ini tidak memerlukan cahaya langsung, tetapi mengandalkan energi yang telah disimpan dalam bentuk molekul energi tinggi seperti ATP dan NADPH dari reaksi terang. Selama reaksi gelap, karbon dioksida (CO2) diambil dari atmosfer dan digunakan untuk menghasilkan glukosa melalui serangkaian reaksi kimia kompleks. Glukosa adalah bentuk energi kimia yang dapat digunakan oleh tumbuhan untuk tumbuh dan berkembang.

ChatGPT Bahasa Indonesia

Carbon Fixation (The Calvin Cycle):
The ATP and high-energy electrons produced in the light reactions are used in the Calvin Cycle, which is also known as the dark reactions or the light-independent reactions. This cycle takes place in the stroma of the chloroplast and involves a series of enzymatic reactions that convert carbon dioxide (CO2) from the atmosphere into glucose. The key steps in the Calvin Cycle include:

a. Carbon Fixation: In this initial step, CO2 is combined with a five-carbon compound called ribulose-1,5-bisphosphate (RuBP) to form a three-carbon compound called 3-phosphoglycerate (3-PGA).

b. Reduction: ATP and NADPH (formed in the light reactions) are used to convert 3-PGA into another three-carbon molecule called glyceraldehyde-3-phosphate (G3P).

c. Regeneration of RuBP: Some of the G3P molecules are used to regenerate RuBP, which is essential for the continued operation of the Calvin Cycle.

d. Glucose Formation: The remaining G3P molecules are used to produce glucose and other carbohydrates through a series of chemical reactions.

ChatGPT Bahasa Inggris

Bagian ketiga ini lebih jelas lagi memperlihatkan kekurangan Chat GPT bahasa Indonesia. Kita lihat ChatGPT bahasa Inggris memberikan penjabaran lebih lengkap dari elemen seperti ATP dan NADPH, sedangkan hanya disebutkan saja di versi jawaban Chat GPT Indonesia.

ChatGPT bahasa Inggris juga menjabarkan elemen RuBP yang sama sekali tidak disinggung oleh jawaban ChatGPT bahasa Indonesia. Kita lihat bagian terakhir.

Penjelasan Keempat Jawaban ChatGPT: Jelas Mana yang Lebih Baik

Produksi Glukosa: Selama reaksi gelap, glukosa dan molekul-molekul organik lainnya, seperti fruktosa dan sukrosa, dihasilkan sebagai produk akhir fotosintesis. Glukosa adalah sumber utama energi untuk tumbuhan dan berfungsi sebagai bahan bakar untuk pertumbuhan, perbaikan, dan reproduksi.

Chat GPT Indonesia

Oxygen Release:
During the light reactions, oxygen is produced as a byproduct when water molecules are split. This oxygen is released into the atmosphere as a waste product.

The overall chemical equation for photosynthesis can be summarized as follows:
6 CO2 + 12 H2O + light energy ā†’ C6H12O6 (glucose) + 6 O2 + 6 H2O

Chat GPT Inggris

Di bagian empat, ChatGPT Indonesia sudah terlihat ketinggalan karena hanya membahas topik glukosa yang sudah lebih dulu dijelaskan oleh ChatGPT bahasa Inggris di point 3.d. Lebih lagi, ChatGPT bahasa Inggris sudah sampai ke bagian pelepasan oksigen yang kemudian disertai formulasi biologi. Semua ini sama sekali tidak disebutkan oleh ChatGPT berbahasa Indonesia.

Kesimpulan dan Solusi

Dari semua bahan di atas terlihat jelas perbedaan kualitas output antara aplikasi Chat GPT bahasa Indonesia vs bahasa Inggris yang tidak seimbang. Apakah kemudian berarti kita tidak bisa pakai Chat GPT dalam bahasa Indonesia? Sama sekali tidak.

Kita hanya perlu mengingat bahwa Chat GPT Indonesia punya kelemahan dalam tugas yang rumit, kompleks atau memerlukan pemahaman mendalam. Kelemahan ini pun sebenarnya ada cara untuk mengakalinya – akan ditulis di artikel terpisah.

Tapi untuk tugas-tugas sederhana, ChatGPT akan tetap bisa memberikan manfaat besar dalam bahasa Indonesia! Contohnya seperti berikut:

ChatGPT dapat digunakan untuk belajar bahasa Inggris.
Bermanfaat dalam membantu terjemahan dasar.
Menyediakan informasi umum yang berguna.
Membantu dalam kebutuhan akademik dan sekolah.
Dapat digunakan untuk menulis berbagai macam surat atau email.
Menjadi sumber ide dan inspirasi untuk proyek kreatif.
Berfungsi sebagai alat simulasi saat mau wawancara kerja.
Memberikan panduan dan informasi wisata.
Membantu analisa data input.
Membantu dalam proses penelitian.
Masih banyak lainnya

Selain itu, seiring semakin banyaknya ChatGPT dipakai oleh masyarakat Indonesia, OpenAI akan punya semakin banyak training data untuk akhirnya membuat model jadi semakin fasih dalam bahasa dan budaya Indonesia (yes, data kita dipakai oleh OpenAI untuk training). Dalam jangka panjang, tingkat ketelitian, kualitas relevansi dan akurasi jawaban ChatGPT dalam bahasa Indonesia seharusnya membaik melalui partisipasi aktif pengguna di Indonesia.

Jadi jangan sungkan untuk tetap memakai Chat GPT bahasa Indonesia. Ada banyak sekali tugas-tugas sederhana sehari-hari yang dapat dibantu oleh ChatGPT (dan LLM lainnya) dengan hasil yang bagus.

Cukup diingat saja: ketika kita mencoba memberikan tugas yang lebih memerlukan pemahaman mendalam, ada kemungkinan instruksi ChatGPT dalam bahasa Indonesia akan memberikan hasil yang tidak terlalu detail. Sebagai solusi, kamu bisa mencoba memberikan instruksi dalam bahasa Inggris untuk mencapai hasil yang lebih detail.

Bingung cara menulis instruksi bahasa Inggris ke ChatGPT untuk mendapatkan terbaik? Blog ID62 inilah jawabannya! Saya akan memberikan banyak prompt templates atau pola instruksi bahasa Inggris untuk berbagai macam kebutuhan yang bisa di copy-paste, dimodifikasi atau bahkan dikembangkan menjadi sesuatu yang lebih rumit.

Supaya tidak ketinggalan dengan segala materi dan update dunia AI yang bergerak cepat sekali, kamu perlu join mailing list gratis ID62 DISINI dan menerima semua update terbaru dalam 1 email!

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top