Home
» Wiki
»
Mengapa AI tidak boleh menulis teks pada imej?
Mengapa AI tidak boleh menulis teks pada imej?
Jika anda telah menggunakan alatan AI Generatif untuk mencipta imej, anda mungkin menghadapi masalah menulis teks dalam imej. Mengetahui mengapa ini berlaku akan membantu mengelakkan masalah ini, serta mencari cara untuk menyelesaikannya.
Sebab terbesar mengapa AI tidak boleh menulis teks adalah kerana data input masa lalu. Walaupun AI cukup bagus dalam menjana imej secara umum, beberapa aspek seperti teks belum digunakan pada tahap yang sama untuk melatih model bahasa besar (LLM) . Oleh itu, AI tidak begitu mahir dalam menghasilkan teks dalam imej.
Walaupun agak maju, alatan AI masih secara teknikal di peringkat awal. Tambahan pula, beberapa alat AI kehabisan data latihan. Masih ada kemungkinan alat penjana boleh menghasilkan teks yang lebih baik, tetapi buat masa ini, anda perlu mencuba alternatif.
Adakah terdapat alternatif kepada teks tidak boleh dibaca dalam imej AI?
Walaupun menjana teks dalam imej AI agak sukar, ia tidak mustahil. Berikut adalah kaedah yang paling berkesan pada masa ini...
1. Berikan alat gesaan yang lebih khusus
Apabila orang mula-mula mula menggunakan AI, kemahiran menulis segera mereka selalunya di bawah standard. Kesilapan terbesar ialah memberikan gesaan yang samar-samar seperti "buat imej pemandangan jalanan".
Tidak hairanlah anda mendapat keputusan yang tidak memuaskan. Cara terbaik untuk menggunakan Generative AI ialah menganggap gesaan anda sebagai ringkasan kreatif. Lebih spesifik lagi bagus. Berikut ialah contoh gesaan:
Cipta imej bahagian luar kafe Itali. Saya mahu ia mempunyai tulisan "Kafe" sebagai tanda, dan ia sepatutnya pada hari yang cerah.
Terjemahan kasar : Cipta imej luaran kafe Itali. Saya mahu imej mempunyai perkataan "Kafe" pada papan tanda dan pada hari yang cerah.
Seperti yang anda lihat daripada imej di bawah, ChatGPT melakukannya dengan baik. Ini tidak akan berlaku jika anda hanya berkata "Buat imej luaran kafe Itali".
Imej kedai kopi yang dicipta di DALL-E
Dalam pengalaman peribadi, imej mudah nampaknya lebih berkesan. Sebagai contoh, imej di atas mempunyai lebih sedikit elemen daripada imej yang diuji di bawah — bermakna AI mempunyai kurang untuk mencuba dan belajar.
Pemandangan jalanan dilaraskan dalam apl DALL-E 3
2. Gunakan variasi perkataan "Teks"
Menukar sedikit bahasa dalam gesaan boleh membuat perbezaan yang besar. Selepas mencuba istilah "teks" beberapa kali, anda akan mula berasa seperti berada dalam kalangan, jadi cuba sinonim yang berbeza.
Sebagai contoh, bukannya "teks", anda boleh mencuba:
Tajuk
Abjad
Perkataan bertulis
Simbol
Jika semua ini tidak berfungsi, teruskan mencuba alternatif. Perkara yang berfungsi dan perkara yang tidak berkesan boleh berbeza-beza bergantung pada perkara yang anda cuba buat. Sebagai contoh, anda mungkin tidak akan menggunakan "simbol" jika anda cuba mereka bentuk kad hari lahir. Bereksperimen dengan idea gesaan AI yang berbeza adalah penting di sini, dan alatan yang berbeza boleh berfungsi dengan cara yang berbeza.
3. Tambah teks menggunakan alat ganti
Anda tidak sepatutnya menambah teks melalui alat ganti jika perkataan itu sepatutnya menjadi sebahagian daripada imej, tetapi adalah idea yang baik jika anda cuba mencipta lebih banyak grafik. Ia akan berfungsi jika anda ingin mereka bentuk kad, grafik, kulit buku atau sesuatu yang serupa.
Jika anda akan melakukan ini, pastikan terdapat ruang yang mencukupi dalam imej. Anda boleh menggunakan mana-mana alat yang anda ingin tambahkan teks pada imej anda. Canva atau Adobe Photoshop Express ialah pilihan yang disyorkan, tetapi apl lain yang membenarkan anda menambah teks pada imej pada telefon pintar anda juga akan berfungsi dengan kandungan yang anda buat menggunakan AI.
Anda juga harus memastikan bahawa teks sepadan dengan imej yang dijana AI. Gunakan fon yang sepadan dengan mood yang anda cuba sampaikan dan bentuk semula perkara yang anda rasa perlu.
4. Pastikan teks pendek
Penjanaan teks imej AI sering gagal kerana anda cuba menambah terlalu banyak teks. Sejujurnya, ini berlaku apabila anda cuba mencipta sesuatu yang lebih panjang daripada 10 aksara. Sama seperti cadangan untuk memastikan imej mudah, anda harus melakukan segala yang anda boleh untuk memastikan teks anda pendek.
Untuk menguji ini, pengarang mencuba gesaan lain:
Sila jana imej bank dengan teks "bank" di luar. Saya mahu ia berada di kawasan pusat bandar dan struktur moden, seperti yang anda akan lihat di bandar AS.
Terjemahan kasar : Buat imej bank dengan perkataan "bank" di bahagian luar. Saya mahu ia menjadi pusat bandar dan mempunyai struktur moden, seperti yang anda akan lihat di bandar Amerika.
Seperti yang anda lihat di bawah, enjin AI melakukan kerja yang cukup baik untuk mendengar pengguna. Walau bagaimanapun, terdapat beberapa ralat dalam satu bahagian imej. Jadi beritahu AI bahawa anda hanya mahu satu atau dua tanda untuk mengehadkan peluang ini berlaku. Isu ini juga nampaknya berlaku apabila teks lebih kecil, jadi ingatlah itu.
Imej bangunan moden dicipta dalam DALL-E
5. Gunakan alatan untuk membetulkan ralat teks
Sama seperti cara anda boleh mengalih keluar kecacatan dalam foto yang diambil dengan kamera anda, anda boleh cuba menggunakan alat yang membantu membetulkan ralat teks dalam foto. Terdapat banyak apl yang membetulkan omong kosong dalam foto yang dijana AI, seperti Storia Lab.
Storia Lab AI Textify Tool Ralat
Apabila menggunakan alat ini, anda biasanya boleh memilih teks dan menukar kandungan mengikut kesesuaian. Sesetengah apl adalah percuma, tetapi dalam kes lain, anda memerlukan langganan berbayar. Jika anda mencipta banyak imej dengan AI, anda boleh membeli pelan bulanan atau tahunan untuk mengaksesnya pada bila-bila masa yang anda perlukan.
6. Gunakan alatan AI untuk menjana teks yang tepat
Anda mungkin pernah mendengar tentang Midjourney , DALL-E, Firefly dan penjana imej AI yang serupa. Tetapi adakah anda tahu bahawa terdapat penjana seni AI khusus yang menghasilkan teks yang tepat dalam imej?
Memandangkan salah satu ciri khusus Ideogram ialah mencipta teks yang boleh dibaca, anda pasti boleh mencuba aplikasi ini untuk beberapa ciptaan anda. Ideogram mempunyai ciri Magic Prompt yang memanjangkan ciri asal anda, bermakna anda boleh mendapatkan hasil yang lebih tepat. Selain pelan percuma, pelan langganan berbayar bermula pada $8/bulan.
Walaupun AI mempunyai kelemahan dalam mencipta imej dengan teks yang boleh dibaca, anda akan menemui beberapa alternatif jika anda bersedia untuk berfikir di luar kotak. Kadangkala pilihan terbaik ialah memberikan alat anda gesaan terperinci yang kurang bertutur untuk diproses. Anda juga mungkin ingin menyelesaikan masalah dalam imej anda dengan perisian lain atau menggunakan alatan yang direka khusus untuk mencipta teks yang tepat.