Model Penilaian Berbasis Ilmiah untuk Mengevaluasi Proposal Komersial

Lebih dari 80 studi peer-reviewed menunjukkan bahwa elemen spesifik dan terukur dalam proposal secara langsung memprediksi apakah Anda menang atau kalah. Berdasarkan wawasan ini, kami mengembangkan model penilaian AI yang mengevaluasi 14 dimensi.

Bagaimana kami sampai pada model evaluasi AI kami: tinjauan literatur tentang efektivitas proposal, ilmu persuasi, dan evaluasi otomatis

Abstrak

Kualitas proposal bukan hal subjektif. Itulah pesan inti artikel ini.

Lebih dari 80 studi peer-reviewed, meta-analisis, dan kerangka kerja profesional yang mapan menunjukkan bahwa elemen spesifik dan terukur dalam proposal secara langsung memprediksi apakah Anda menang atau kalah dalam penugasan. Tiga tingkat harga meningkatkan pendapatan per pelanggan Anda sebesar 30%. Menampilkan referensi meningkatkan konversi sebesar 270%. Desain profesional membuat proposal Anda 43% lebih persuasif. Dan personalisasi menghasilkan hingga 40% lebih banyak pendapatan (Arora et al., 2021; Simonson, 1989; Spiegel Research Center, 2017; Vogel et al., 1986).

Berdasarkan wawasan ilmiah ini, kami mengembangkan model penilaian yang mengevaluasi 14 dimensi, dibagi di sepuluh bagian proposal dan empat dimensi kualitas menyeluruh. Model ini dirancang agar AI dapat menerapkannya secara konsisten dan andal. Penelitian menunjukkan bahwa evaluasi berbasis AI menggunakan rubrik terstruktur sekarang mencapai lebih dari 80% kesesuaian dengan ahli manusia, sebanding dengan apa yang dicapai evaluator manusia di antara mereka sendiri (Zheng et al., 2023).

Rata-rata tingkat kemenangan dalam penawaran kompetitif adalah 45% (Loopio, 2025). Organisasi yang menerapkan kerangka kerja kualitas terstruktur secara rutin menggandakan tingkat kemenangan tersebut (Lohfeld Consulting Group, 2022). Perbedaan itulah yang persis dibuat terlihat dan dapat dicapai oleh model penilaian ini.

Bagian I: Mengapa Beberapa Proposal Menang dan Lainnya Kalah

Ilmu di balik efektivitas proposal

Apa yang menentukan apakah proposal menang? Literatur akademis dan profesional memberikan jawaban yang jelas. Hubungan yang sudah ada dengan klien adalah prediktor terkuat. Pemasok yang sudah ada menang dalam 60 hingga 90% kasus, dibandingkan dengan rata-rata industri 45% (Seibert, 2018).

Tetapi ketika kita mengesampingkan faktor hubungan, kualitas proposal itu sendiri membuat perbedaan yang sangat besar. Lohfeld Consulting Group menganalisis kasus protes di U.S. Government Accountability Office dan menyimpulkan bahwa proposal dengan lebih banyak kekuatan yang teridentifikasi secara eksplisit menang, bahkan dengan harga yang lebih tinggi. Proposal dengan beberapa kekurangan dinilai sebagai "tidak layak mendapat kontrak," terlepas dari harga (Crist, 2022).

Tiga kerangka kerja profesional membentuk fondasi struktural model kami:

Metode Shipley (didirikan pada tahun 1972) digunakan di seluruh dunia oleh perusahaan Fortune 100. Prinsip utamanya: tulis dari perspektif klien, bukan dari perspektif Anda sendiri. Buka setiap bagian dengan poin terpenting Anda (Bottom Line Up Front) dan ikuti proses tinjauan terstruktur dari strategi hingga pemeriksaan akhir.

APMP Body of Knowledge menggambarkan 22 kompetensi dan secara eksplisit mengintegrasikan ilmu persuasi. Pedoman mereka merujuk pada Elaboration Likelihood Model (Petty & Cacioppo, 1986) dan prinsip-prinsip pengaruh Cialdini.

Metodologi Lohfeld Strength-Based Winning mengatakannya dengan tajam: "Proposal dinilai, bukan dibaca." Jumlah dan kualitas kekuatan yang diartikulasikan secara eksplisit menentukan hasilnya (Lohfeld Consulting Group, 2022).

Dan kemudian ada personalisasi. Penelitian McKinsey menunjukkan bahwa perusahaan yang unggul dalam personalisasi menghasilkan 40% lebih banyak pendapatan dibandingkan perusahaan berkinerja rata-rata (Arora et al., 2021). Prinsip yang sama berlaku untuk proposal: respons generik yang di-copy-paste adalah salah satu penyebab utama kekalahan (Loopio, 2025).

Bagaimana evaluator memproses proposal Anda

Elaboration Likelihood Model (Petty & Cacioppo, 1986) menjelaskan bagaimana orang memproses informasi melalui dua jalur.

Melalui jalur sentral, evaluator menganalisis konten dengan cermat: kualitas argumen, kekuatan bukti, dan struktur logis. Ini terjadi ketika seseorang memiliki cukup waktu, keahlian, dan keterlibatan.

Melalui jalur periferal, evaluator mengandalkan sinyal cepat: seberapa profesional tampilannya? Siapa yang ada di baliknya? Apakah ada logo dan referensi yang dapat dikenali? Ini terjadi di bawah tekanan waktu, kelebihan informasi, atau ketika subjek berada di luar keahlian seseorang.

Wawasan pentingnya: kedua jalur beroperasi secara simultan. Pengadaan B2B biasanya melibatkan 6 hingga 10 pemangku kepentingan (Gartner, 2023) dengan peran yang berbeda (Webster & Wind, 1972). Spesialis teknis membaca rencana proyek Anda kata per kata. Eksekutif membolak-balik dan melihat desain, tim, dan referensi. Kitchen et al. (2014) mengkonfirmasi realitas pemrosesan ganda ini dalam konteks bisnis modern.

Proposal yang menang melayani kedua jalur. Itulah mengapa model penilaian kami membobot baik kedalaman substantif maupun presentasi visual.

Tujuh prinsip persuasi yang langsung dapat diterapkan pada proposal

Kerangka pengaruh Cialdini (Cialdini, 2001, 2021) didasarkan pada puluhan tahun penelitian eksperimental. Setiap prinsip langsung dapat diterjemahkan ke proposal:

Resiprositas juga bekerja di atas kertas. Dengan berbagi wawasan berharga dalam proposal Anda di awal (pemindaian cepat, benchmark, saran), Anda menciptakan utang psikologis. Dalam studi restoran Cialdini, hadiah yang dipersonalisasi meningkatkan tip sebesar 23%.

Bukti sosial adalah salah satu mekanisme paling kuat dalam pengadaan. Goldstein et al. (2008) menunjukkan bahwa norma sosial deskriptif meningkatkan perilaku target sebesar 26%. Diterjemahkan ke proposal: tunjukkan bahwa perusahaan sebanding telah memilih Anda.

Otoritas adalah yang membuat sertifikasi dan kredensial begitu berharga. Ketika staf real estate memperkenalkan agen dengan menyebut kualifikasi mereka, janji temu naik 20% dan kontrak yang ditandatangani naik 15% (Cialdini, 2001).

Kelangkaan memanfaatkan fakta bahwa orang menimbang kerugian sekitar dua kali lebih berat daripada keuntungan dengan besaran yang sama (Kahneman & Tversky, 1979). Penawaran terbatas waktu dan ketersediaan terbatas karenanya merupakan teknik penutupan yang efektif.

Komitmen dan konsistensi adalah yang membuat rujukan pada pernyataan klien sebelumnya begitu efektif. Freedman dan Fraser (1966) mendemonstrasikan peningkatan empat kali lipat dalam kepatuhan setelah komitmen kecil awal.

Kesukaan muncul melalui kesamaan dan kolaborasi. Dalam studi MBA, hasil negosiasi meningkat sebesar 18% ketika peserta pertama kali mengidentifikasi kesamaan personal (Cialdini, 2001).

Kesatuan melampaui kesukaan. Dengan menggunakan identitas bersama dan bahasa ko-kreasi ("kita" alih-alih "saya" dan "Anda"), Anda membangun koneksi yang lebih dalam (Cialdini, 2021).

Framing: pesan yang sama, efek yang berbeda

Tversky dan Kahneman (1981) membuktikan bahwa hasil yang identik, dibingkai secara berbeda, sepenuhnya membalikkan preferensi. Levin et al. (1998) mengidentifikasi tiga strategi framing yang langsung dapat diterapkan pada proposal:

Framing atribut: "98% uptime" lebih persuasif daripada "2% downtime." Informasi yang persis sama, tetapi formulasi pertama mendapat skor lebih baik.

Framing tujuan: tekankan apa yang diperoleh klien dengan bertindak, atau apa yang hilang dari klien jika tidak bertindak. Pesan yang dibingkai sebagai kerugian menghasilkan tingkat klik 24% lebih tinggi (Levin et al., 1998).

Anchoring: angka pertama yang disebutkan mewarnai semua penilaian berikutnya. Meta-analisis dari 53 studi mengkonfirmasi efek ini (Li et al., 2021). Bahkan ahli rentan: profesional real estate secara signifikan dipengaruhi oleh harga yang diminta, meskipun mengklaim sebaliknya (Northcraft & Neale, 1987).

Ancaman terbesar dalam B2B, kebetulan, bukan pesaing Anda tetapi status quo. Setidaknya 40% dari semua transaksi pipeline berakhir dengan "tanpa keputusan" (Corporate Visions, 2022). Proposal yang baik mengatasi bukan hanya persaingan tetapi juga inersia klien.

Bahasa yang meyakinkan (dan bahasa yang tidak)

Ta et al. (2022) menyelidiki secara besar-besaran properti linguistik mana yang membuat teks persuasif. Temuan kunci mereka: teks persuasif bersifat analitis, konkret, dan mengandung sedikit referensi diri. Ini bertentangan dengan insting umum untuk mengisi proposal dengan pernyataan "kami."

Blankenship dan Holtgraves (2005) menetapkan bahwa bahasa ragu-ragu secara signifikan mengurangi kekuatan persuasif. Kata-kata seperti "mungkin," "agak," "pada prinsipnya," dan "bisa jadi" merusak pesan Anda. Bahasa yang kuat bersifat langsung dan tegas.

Jenis bukti apa yang paling efektif? Baesler dan Burgoon (1994) menemukan bahwa bukti statistik awalnya lebih persuasif, sementara cerita memiliki efek jangka panjang yang lebih kuat. Pendekatan optimal untuk proposal menggabungkan keduanya: kalkulasi ROI konkret dikombinasikan dengan narasi studi kasus yang relatable.

Bagian II: Fondasi Ilmiah per Bagian Proposal

Halaman depan: penilaian terbentuk dalam 50 milidetik

Penilaian daya tarik visual terbentuk dalam 50 milidetik dan tetap sangat stabil setelahnya (Lindgaard et al., 2006). Halaman depan karenanya menciptakan kesan pertama yang hampir tidak dapat dibalikkan. Fogg et al. (2003) mengkonfirmasi ini dengan 2.684 partisipan: "tampilan desain" adalah faktor kredibilitas terpenting dan muncul dalam 46,1% dari seluruh respons. Itu lebih banyak dari kualitas informasi, kepengarangan, atau faktor lainnya.

Efek halo memperkuat ini lebih lanjut. Begitu kesan pertama yang positif terbentuk, evaluator menginterpretasikan semua konten berikutnya dengan lebih baik (Nisbett & Wilson, 1977). Investasi pada halaman depan Anda karenanya menghasilkan pengembalian yang melampaui halaman tunggal itu.

Bagaimana AI menilai bagian ini:

Skor 9 atau 10 diberikan ketika halaman depan menampilkan logo dan nama klien secara mencolok, mempertahankan identitas merek yang konsisten dengan fotografi profesional, menyatakan dengan jelas judul proyek, tanggal, dan pihak-pihak yang terlibat, dan menggunakan grid visual yang bersih.

Skor 3 atau 4 berarti template Word standar tanpa nama klien, dengan foto stok generik, font yang tidak konsisten, dan tidak ada hierarki informasi yang jelas.

Tentang kami: membangun kepercayaan melalui tiga dimensi

Model kepercayaan yang paling banyak dikutip dalam penelitian organisasi (Mayer et al., 1995; lebih dari 14.000 kutipan) mengidentifikasi tiga dimensi keterpercayaan: kompetensi (bisakah Anda melakukannya?), kebajikan (apakah Anda menginginkan yang terbaik untuk saya?), dan integritas (apakah Anda melakukan apa yang Anda janjikan?).

Meta-analisis oleh Colquitt et al. (2007; 132 sampel) menambahkan wawasan penting: ketika informasi keterpercayaan yang jelas tersedia, informasi itu mengesampingkan kecenderungan kepercayaan alami pembaca. Dengan kata lain: menampilkan sinyal kepercayaan secara eksplisit dalam proposal Anda lebih penting daripada berharap evaluator secara alami mudah percaya.

Edelman Trust Barometer (2023) menunjukkan bahwa persepsi etika tiga kali lebih penting daripada kompetensi untuk kepercayaan institusional. Dalam bagian Tentang Kami Anda, karenanya, tunjukkan tidak hanya apa yang bisa Anda lakukan tetapi juga apa yang Anda perjuangkan.

Bagaimana AI menilai bagian ini:

Skor 8 dibuka dengan cerita pendirian yang menarik yang menghubungkan misi inti dengan masalah klien, menampilkan sertifikasi yang relevan (ISO 27001, Lean Six Sigma), menyebutkan angka konkret ("347 proyek untuk 89 organisasi dalam 5 tahun terakhir"), dan ditutup dengan foto tim.

Skor 4 hanya berisi deskripsi perusahaan generik ("Kami adalah perusahaan muda dan dinamis"), tidak ada angka konkret, tidak ada sertifikasi, dan tidak ada foto.

Rencana proyek: konten yang membuat perbedaan

Ketika evaluator meluangkan waktu untuk benar-benar membaca proposal Anda (jalur sentral dari ELM), kualitas argumen adalah faktor terpenting (Petty & Cacioppo, 1986). APMP Body of Knowledge menetapkan struktur Fitur, Manfaat, Bukti untuk ini: apa yang Anda tawarkan, mengapa itu penting bagi klien, dan bukti bahwa itu berhasil.

Metode Shipley menambahkan prinsip BLUF: buka setiap bagian dengan poin terpenting Anda. Bukan dengan pendahuluan atau cerita latar belakang, tetapi dengan kesimpulan. Penelitian mengkonfirmasi bahwa proposal yang diorganisir berdasarkan kriteria evaluasi klien menerima skor yang secara signifikan lebih tinggi (Shipley Associates, 2019).

Bagaimana AI menilai bagian ini:

Skor 9 dibuka dengan: "Tantangan Anda: waktu penyelesaian saat ini untuk proses proposal adalah 14 hari, mengakibatkan perkiraan €240.000 dalam pendapatan yang hilang per kuartal. Pendekatan kami mengurangi ini menjadi 5 hari." Rencana kemudian menggambarkan setiap fase dengan deliverable konkret, penanggung jawab, dan tujuan yang terukur.

Skor 3 hanya menggambarkan prosesnya sendiri ("Pada fase 1 kami melakukan analisis, pada fase 2 kami mengimplementasikan...") tanpa rujukan pada situasi spesifik klien.

Timeline: tunjukkan, jangan hanya ceritakan

Penelitian tentang visualisasi informasi tidak meragukan: presentasi visual lebih persuasif daripada teks saja. Vogel et al. (1986) menemukan bahwa presentasi dengan dukungan visual 43% lebih persuasif. Meta-analisis oleh Guo et al. (2020) mengkonfirmasi bahwa grafik yang dirancang dengan baik meningkatkan pemahaman dengan ukuran efek 0,35 hingga 0,37. Ketika pembaca secara aktif terlibat dengan visualisasi, ini naik menjadi 0,82 (Nesbit & Adesope, 2006).

Timeline grafis sangat efektif untuk jenis keputusan yang perlu dibuat evaluator: mengenali tren dan membandingkan kuantitas (Jarvenpaa & Dickson, 1988).

Bagaimana AI menilai bagian ini:

Skor tinggi memerlukan timeline visual (Gantt chart atau diagram milestone), penjadwalan realistis dengan tanggal spesifik, milestone yang jelas, ketergantungan, dan waktu buffer untuk risiko.

Skor rendah adalah daftar bullet point tanpa representasi visual, tanpa tanggal spesifik, dan tanpa koneksi ke deliverable dalam rencana proyek.

Proposal harga: ilmu saraf dari persepsi harga

Ini adalah salah satu area yang paling kaya bukti untuk penilaian proposal. Knutson et al. (2007) mendemonstrasikan dengan pemindaian otak bahwa harga tinggi secara harfiah mengaktifkan pusat nyeri di otak, dan bahwa aktivasi ini memprediksi keputusan pembelian. Prelec dan Loewenstein (1998) memformalkan ini sebagai "rasa sakit membayar." Cara Anda menyajikan harga menentukan seberapa banyak rasa sakit yang dialami klien.

Tiga opsi adalah yang optimal. Studi selai terkenal oleh Iyengar dan Lepper (2000) menunjukkan bahwa lebih sedikit pilihan menghasilkan lebih banyak konversi: pengurangan dari 24 menjadi 6 opsi meningkatkan konversi sepuluh kali lipat. Meta-analisis (Chernev et al., 2015; 99 observasi, N = 7.202) mengkonfirmasi ini. Dalam praktik, struktur tiga paket mencapai pendapatan per pelanggan 30% lebih tinggi dibandingkan struktur dengan lima paket atau lebih (Price Intelligently).

Mengapa tiga? Efek kompromi (Simonson, 1989; Simonson & Tversky, 1992) menunjukkan bahwa orang cenderung memilih opsi tengah. Opsi tengah mendapatkan rata-rata 17,5% pangsa pasar tambahan. Efek umpan (Huber et al., 1982) menggeser preferensi rata-rata 11,3% menuju opsi yang ingin Anda jual (Heath & Chatterjee, 1995). Gabungkan wawasan ini dengan memposisikan opsi paling menguntungkan Anda sebagai pilihan tengah yang direkomendasikan.

Transparansi sangat penting. Penelitian McKinsey menunjukkan bahwa 83% pelanggan B2B menganggap transparansi lebih penting daripada reputasi merek (McKinsey & Company, 2022). TrustRadius (2025) melaporkan bahwa 45% pembeli B2B menyebut transparansi harga sebagai prioritas utama mereka.

Bagaimana AI menilai bagian ini:

Skor 10 menyajikan tiga paket dalam tabel perbandingan dengan opsi tengah disorot secara visual sebagai "paling populer." Dibuka dengan kalkulasi ROI: "Penghematan yang diharapkan sebesar €180.000 per tahun membuat investasi €45.000 ini terbayar dalam 3 bulan." Setiap item baris dirinci, ekuivalen per bulan ditampilkan, dan analisis biaya-ketidakbertindakan menutup: "Setiap bulan penundaan merugikan diperkirakan €15.000 dalam inefisiensi."

Skor 2 berisi satu jumlah total tanpa rincian, konteks, atau framing nilai.

Syarat dan ketentuan: mitigasi risiko sebagai mekanisme kepercayaan

Garansi dan syarat-syarat bekerja berbeda dari yang dipikirkan kebanyakan orang. Mereka berfungsi tidak terutama sebagai sinyal kualitas tetapi sebagai mitigasi risiko. Studi pemodelan persamaan struktural (Kliestikova et al., 2023; n = 180) menemukan bahwa mitigasi risiko adalah pendorong terkuat dari nilai garansi (β = 0,798, p < 0,001).

Ini juga menjelaskan mengapa garansi yang murah hati bekerja begitu baik. Eksperimen konversi menunjukkan bahwa memperpanjang garansi dari 90 hari ke satu tahun menggandakan konversi, sementara tingkat pengembalian hanya meningkat 3% (Conversion Fanatics, 2019). Teori sinyal (Moorthy & Srinivasan, 1995) menjelaskan mengapa: hanya perusahaan yang yakin dengan kualitasnya yang mampu menawarkan garansi yang murah hati.

Pavlou dan Gefen (2004) mengidentifikasi lima mekanisme kepercayaan institusional dalam B2B: pemantauan, jaminan hukum, akreditasi, sistem umpan balik, dan norma kooperatif. Untuk syarat dan ketentuan dalam proposal, ini berarti: alokasi risiko yang jelas, SLA spesifik, klausul pemutusan yang adil, cakupan asuransi yang relevan, dan bahasa yang mudah dipahami.

Bagaimana AI menilai bagian ini:

Skor tinggi berisi jaminan kinerja spesifik, alokasi risiko yang jelas, klausul pemutusan yang transparan dalam bahasa yang mudah dipahami, dan syarat pembayaran berbasis milestone yang mengurangi risiko yang dirasakan.

Skor rendah berisi jargon hukum yang tidak dapat ditembus, syarat sepihak, dan tidak ada jaminan kinerja.

Tim: orang berbisnis dengan orang

Prinsip otoritas (Cialdini, 2001) dan dimensi kompetensi dari model kepercayaan Mayer et al. (1995) keduanya menunjuk ke arah yang sama: presentasi tim adalah salah satu pembangun kepercayaan yang paling kuat. Menambahkan foto tim memberikan "jaminan ekstra" bagi calon klien (Nielsen Norman Group, 2020).

Detail yang menarik: pengenalan pihak ketiga lebih efektif daripada promosi diri, bahkan ketika pihak yang memperkenalkan memiliki kepentingan pribadi (Cialdini, 2001). Ini berarti bahwa kredensial yang divalidasi secara eksternal (sertifikasi, publikasi, undangan sebagai pembicara) lebih persuasif daripada deskripsi diri tentang keterampilan. Meta-analisis oleh Reinard (1998) mengkonfirmasi ini: testimoni ahli meningkatkan kekuatan persuasif dengan ukuran efek r = 0,25.

Bagaimana AI menilai bagian ini:

Skor 8 menunjukkan foto profesional dari tiga anggota tim, masing-masing dengan nama, jabatan, sertifikasi yang relevan (misalnya, "PMP, Lean Six Sigma Black Belt"), hasil proyek konkret ("Mengurangi waktu penyelesaian sebesar 40% pada proyek sebanding untuk [nama klien]"), dan peran spesifik mereka dalam proyek yang diusulkan.

Skor 3 hanya mencantumkan nama dan jabatan tanpa foto, kualifikasi, atau pengalaman yang relevan dengan proyek.

Referensi: alat persuasi terkuat dalam B2B

Angka-angkanya mengesankan. Spiegel Research Center di Northwestern University (2017) menemukan bahwa menampilkan hanya lima ulasan meningkatkan kemungkinan pembelian sebesar 270%. Untuk produk berharga lebih tinggi, ini naik hingga 380%. Menariknya, kemungkinan pembelian tidak memuncak pada skor sempurna: titik optimal berada di 4,0 hingga 4,7 bintang. Skor sempurna 5,0 justru menimbulkan skeptisisme.

Bentuk bukti mana yang paling efektif? Meta-analisis oleh Freling et al. (2020; 61 studi) menemukan bahwa bukti statistik umumnya lebih kuat daripada bukti anekdotal, tetapi bahwa testimoni menjadi lebih persuasif ketika keterlibatan emosional tinggi. Format studi kasus yang optimal karenanya menggabungkan keduanya: narasi dari masalah ke solusi ke hasil, dengan angka spesifik.

Dalam B2B, 97% pelanggan menyebut testimoni dan rekomendasi rekan sebagai jenis konten yang paling tepercaya (Demand Gen Report, 2023). Dan 73% pembeli menggunakan studi kasus dalam keputusan pembelian (Heinz Marketing, 2022). Referensi bukan "nice to have." Mereka esensial.

Bagaimana AI menilai bagian ini:

Skor tinggi berisi tiga atau lebih studi kasus dengan nama, masalah, solusi, hasil, dan metrik ROI. Selain itu, logo klien yang dapat dikenali dari industri prospek, testimoni dengan nama dan foto, dan referensi dari tahun terakhir.

Skor rendah berisi klaim samar ("klien kami puas"), testimoni anonim, dan tidak ada studi kasus konkret.

Video: pengganda keterlibatan

Video dalam proposal memberikan hasil yang terukur. Perusahaan yang menggunakan video mencapai konversi lead-to-sale 54% lebih tinggi (Aberdeen Group, 2018). Pengambil keputusan B2B hampir dua kali lebih mungkin menonton video selama riset pembelian (Forbes Insights & Google, 2018). Keunggulan memori sangat signifikan: orang mengingat sekitar 95% dari pesan video versus 10% dari teks (Insivia, 2020).

Tetapi catatan: kualitas penting. 62% pelanggan membentuk opini merek yang lebih buruk setelah menonton video berkualitas rendah (Adelie Studios, 2020). Durasi optimal di bawah dua menit, dengan tingkat penyelesaian 85%. Video yang dipersonalisasi menghasilkan tingkat buka 29% lebih tinggi dan tingkat klik 41% lebih tinggi dibandingkan video generik.

Bagaimana AI menilai bagian ini:

Skor tinggi berisi video perkenalan yang dipersonalisasi dan berkualitas tinggi, lebih pendek dari dua menit, dengan presenter manusia yang menyapa prospek dengan nama.

Skor rendah tidak berisi video, atau video korporat generik dengan kualitas produksi rendah.

Galeri foto: bukti visual yang melekat

Orang mengingat gambar lebih baik daripada kata-kata. Efek superioritas gambar (Nelson et al., 1976) menetapkan bahwa kita mengingat sekitar 65% informasi visual versus 10 hingga 20% konten tertulis atau lisan.

Meta-analisis oleh Seo (2020; 12 studi, 2.452 partisipan) menambahkan nuansa: tidak semua gambar meyakinkan. Foto mendapat skor signifikan lebih baik daripada ilustrasi (r = 0,077, p = 0,038), dan gambar positif menunjukkan efek yang cukup signifikan (r = 0,185, p < 0,001). Messaris (1997) mengidentifikasi mengapa foto begitu kuat: mereka memberikan bukti dokumenter, membangkitkan respons emosional, dan menyiratkan tanpa menyatakan secara eksplisit.

Untuk perusahaan layanan, foto sebelum-dan-sesudah menjembatani kesenjangan invisibilitas. Mereka berfungsi sebagai testimoni visual yang memberikan bukti konkret tentang kompetensi.

Bagaimana AI menilai bagian ini:

Skor tinggi berisi fotografi profesional orisinal, portofolio proyek dengan konteks dan deskripsi, dokumentasi sebelum-dan-sesudah, dan kualitas gambar yang konsisten.

Skor rendah berisi foto stok generik yang tidak terkait dengan proposal, atau tidak ada materi visual sama sekali.

Bagian III: Dimensi Kualitas Menyeluruh

Kualitas bahasa: penanda persuasi yang terukur

Di luar konten per bagian, model kami mengevaluasi empat dimensi yang berlaku di seluruh proposal. Yang pertama adalah kualitas bahasa.

Penelitian mengidentifikasi beberapa fitur linguistik yang dapat diukur oleh AI dan berkorelasi dengan kekuatan persuasif:

Keterbacaan: Lohfeld Consulting Group merekomendasikan Flesch Reading Ease minimal 60 dan Flesch-Kincaid Grade Level tidak lebih dari 12. Parhankangas dan Ehrlich (2014) menemukan bahwa penggunaan bahasa dalam proposal bisnis secara positif memengaruhi keputusan pendanaan. Studi di Kickstarter mencapai akurasi prediksi keberhasilan pendanaan 73% berdasarkan metrik keterbacaan.

Kalimat aktif: bidik tidak lebih dari 15% kalimat pasif (Lohfeld Consulting Group, 2022). Kalimat aktif menyampaikan kepercayaan diri dan ketegasan.

Bahasa yang kuat: hindari kata-kata ragu-ragu dan disclaimer (Blankenship & Holtgraves, 2005). Jangan tulis "kami mungkin bisa mencapai ini" tetapi "kami akan mencapai ini."

Bahasa berfokus pada klien: lebih sedikit "kami" dan lebih banyak "Anda" berkorelasi dengan kekuatan persuasif yang lebih tinggi (Ta et al., 2022).

Bahasa konkret: formulasi konkret lebih persuasif daripada konsep abstrak (Ahmad & Laroche, 2015). Jangan tulis "pengurangan biaya yang signifikan" tetapi "penghematan €47.000 per tahun."

Kedalaman personalisasi

Model kami mengevaluasi personalisasi pada empat level:

Level 1 (tanpa penyesuaian): bahasa template tanpa rujukan pada klien sama sekali.

Level 2 (dasar): nama klien telah dimasukkan, tetapi kontennya sebaliknya generik.

Level 3 (moderat): rujukan pada industri dan situasi umum klien.

Level 4 (mendalam): rujukan pada tantangan klien spesifik yang dibahas dalam percakapan sebelumnya, penggunaan bahasa dan terminologi klien sendiri, dan keselarasan dengan tujuan strategis mereka.

Data McKinsey tentang peningkatan pendapatan 40% melalui keunggulan personalisasi (Arora et al., 2021) mengkonfirmasi bahwa ini layak mendapat dimensi penilaian dengan bobot tinggi.

Struktur dan alur

Prinsip BLUF Shipley, pedoman APMP untuk mengorganisir dari perspektif evaluator, dan ELM semuanya mendukung penilaian pada arsitektur informasi. AI mengevaluasi: apakah ada ringkasan eksekutif? Apakah masalah datang sebelum solusi? Nilai sebelum harga? Apakah ada judul bagian yang jelas? Apakah setiap bagian mengikuti struktur fitur, manfaat, bukti?

Kerangka BuyGrid (Robinson et al., 1967) menambahkan bahwa struktur harus sesuai dengan jenis pembelian. Pembelian yang sepenuhnya baru memerlukan proposal yang paling komprehensif. Pembelian ulang dengan modifikasi harus berfokus pada peningkatan relatif terhadap situasi saat ini.

Kejelasan ajakan bertindak

Satu ajakan bertindak yang ditempatkan dengan baik meningkatkan keterlibatan sebesar 371% dibandingkan beberapa item tindakan yang bersaing. AI mengevaluasi apakah proposal berisi langkah-langkah selanjutnya yang jelas, apakah urgensi dibingkai di sekitar peristiwa eksternal nyata (siklus anggaran, jendela implementasi), dan apakah ambang komitmen diturunkan melalui tawaran yang dapat dibatalkan seperti pilot atau masa uji coba.

Untuk pembeli B2B yang menghindari risiko, di mana setidaknya 40% default ke "tanpa keputusan" (Corporate Visions, 2022), justru penurunan ambang inilah yang krusial.

Bagian IV: Kerangka Penilaian Berbobot

Bobot kategori dan fondasi ilmiahnya

Bobot dalam model kami mencerminkan kontribusi relatif setiap dimensi terhadap efektivitas proposal. Kami menentukannya dengan melakukan triangulasi dari tiga sumber: ukuran efek dari meta-analisis, frekuensi kutipan dalam kerangka kerja profesional, dan dampak terukur pada tingkat kemenangan dan konversi.

KategoriBobotDasar Ilmiah
Proposal Harga15%Teori prospek (Kahneman & Tversky, 1979); anchoring (Li et al., 2021); efek kompromi (Simonson, 1989); ilmu saraf rasa sakit harga (Knutson et al., 2007)
Rencana Proyek14%Jalur sentral ELM (Petty & Cacioppo, 1986); penilaian berbasis kekuatan Lohfeld; Fitur, Manfaat, Bukti APMP
Referensi12%Peningkatan konversi 270% (Spiegel Research Center, 2017); meta-analisis 61 studi (Freling et al., 2020)
Tentang Kami10%Model kepercayaan oleh Mayer et al. (1995; 14.000+ kutipan); Colquitt et al. (2007; 132 sampel)
Halaman Depan8%Pembentukan kesan 50ms (Lindgaard et al., 2006); penelitian kredibilitas Stanford (Fogg et al., 2003)
Tim8%Prinsip otoritas (Cialdini, 2001); Reinard (1998; r = 0,25)
Kualitas Bahasa7%Ta et al. (2022); Blankenship & Holtgraves (2005); Parhankangas & Ehrlich (2014)
Syarat dan Ketentuan5%Mitigasi risiko (Kliestikova et al., 2023; β = 0,798); teori sinyal (Moorthy & Srinivasan, 1995)
Timeline5%Visualisasi informasi (Guo et al., 2020); kekuatan persuasif visual (Vogel et al., 1986)
Personalisasi5%Peningkatan pendapatan 40% (Arora et al., 2021); mediasi kepercayaan-niat pembelian (Tran et al., 2021)
Struktur dan Alur3%BLUF Shipley; APMP berfokus evaluator; jalur ganda ELM
Video3%Konversi 54% lebih tinggi (Aberdeen Group, 2018)
Galeri Foto3%Efek superioritas gambar (Nelson et al., 1976); Seo (2020; r = 0,185)
Ajakan Bertindak2%Peningkatan keterlibatan 371%; literatur bias status quo
Total100%

Rubrik penilaian terperinci (1 hingga 10 per dimensi)

Setiap dimensi dinilai pada skala 1 hingga 10 dengan lima level kinerja:

Skor 9 atau 10 (luar biasa): semua praktik terbaik diimplementasikan, beberapa prinsip persuasi diterapkan, bukti terkuantifikasi hadir, eksekusi profesional yang melampaui standar industri, penyesuaian khusus klien di seluruh dokumen.

Skor 7 atau 8 (kuat): sebagian besar praktik terbaik diimplementasikan, penggunaan strategis yang jelas dari teknik persuasi, kualitas profesional, penyesuaian yang baik dengan beberapa elemen generik.

Skor 5 atau 6 (memadai): persyaratan dasar terpenuhi, beberapa elemen persuasi tetapi tidak konsisten diterapkan, profesional tetapi tidak menonjol, penyesuaian moderat.

Skor 3 atau 4 (di bawah rata-rata): kesenjangan signifikan dalam praktik terbaik, strategi persuasi minimal, kualitas tidak konsisten, konten sebagian besar generik.

Skor 1 atau 2 (buruk): kekurangan besar, tidak ada strategi persuasi, kualitas tidak profesional, tidak ada penyesuaian, elemen kritis hilang.

Bagian V: Implementasi AI dan Keandalan

Bisakah AI mengevaluasi proposal secara andal?

Ya. Dan buktinya meyakinkan.

Zheng et al. (2023) mendemonstrasikan bahwa GPT-4 mencapai lebih dari 80% kesesuaian dengan preferensi manusia. Itu sebanding dengan apa yang dicapai evaluator manusia di antara mereka sendiri. Kim et al. (2024) mencapai dengan model Prometheus mereka korelasi Pearson sebesar 0,897 dengan evaluator manusia ketika menggunakan rubrik khusus. Pack dan Maloney (2024) menemukan bahwa GPT-4 mencapai korelasi 0,731 untuk penilaian esai, sebanding dengan sistem e-rater yang sudah mapan (Burstein & Chodorow, 1999; r = 0,693).

Untuk menempatkan ini dalam perspektif: meta-analisis oleh Bornmann et al. (2010; 48 studi) menemukan bahwa bahkan ahli manusia hanya mencapai rata-rata reliabilitas antar-penilai ICC = 0,34 untuk penilaian kualitas dokumen. Sistem AI yang terkalibrasi dengan baik karenanya tidak hanya andal tetapi bahkan dapat menilai lebih konsisten daripada rata-rata evaluator manusia.

Arsitektur penilaian kami: tiga lapisan untuk keandalan maksimal

Model kami menggabungkan pengukuran deterministik dengan evaluasi AI dalam tiga langkah:

Langkah 1 (deterministik): AI mengukur fitur objektif seperti keterbacaan (Flesch-Kincaid, Gunning Fog), persentase kalimat pasif, rata-rata panjang kalimat, frekuensi referensi diri, keberadaan elemen struktural (judul, tabel, timeline), jumlah dan kualitas gambar, dan kelengkapan bagian.

Langkah 2 (evaluasi rubrik): AI menerapkan kerangka G-Eval (Liu et al., 2023), pertama mendefinisikan kriteria evaluasi, kemudian bernalar langkah demi langkah (chain-of-thought), dan kemudian memberikan skor. Metode ini mencapai korelasi Spearman 0,514 dengan penilaian manusia, secara signifikan lebih baik daripada semua metrik tradisional.

Langkah 3 (pemeriksaan konsistensi): penilaian dilakukan tiga kali dan dirata-ratakan untuk mengurangi varians. Untuk evaluasi kritis, juri multi-model (3 hingga 5 model AI berbeda dengan pemungutan suara mayoritas) dapat mengurangi bias sebesar 30 hingga 40%.

Bagaimana kami menjaga rubrik tetap andal

Penelitian dari pengukuran pendidikan dan evaluasi AI menunjukkan enam praktik terbaik yang kami terapkan:

Kami menggunakan rubrik analitis dengan skor terpisah per kriteria. Ini memungkinkan diagnostik terperinci dan meningkatkan konsistensi. Per kriteria, kami menggunakan lima level kinerja yang jelas. Lebih dari lima level mengurangi keandalan. Untuk setiap level, kami menyertakan contoh jangkar untuk mengkalibrasi model, pendekatan yang terbukti efektif bahkan dengan model AI yang lebih kecil (Kim et al., 2024). AI harus bernalar langkah demi langkah sebelum memberikan skor, yang meningkatkan keandalan sebesar 10 hingga 15% (Zheng et al., 2023). Sedapat mungkin, kami menguraikan penilaian subjektif menjadi pemeriksaan ya/tidak biner ("Apakah proposal berisi timeline visual?"). Dan kami mengunci versi model dengan rekalibrasi berkala, karena pembaruan API dapat memengaruhi konsistensi penilaian (Pack & Maloney, 2024).

Jujur tentang keterbatasan

Transparansi adalah salah satu prinsip persuasi yang kami gambarkan dalam artikel ini, dan kami menerapkannya pada diri kami sendiri juga.

Penilaian AI lebih kuat pada fitur yang terukur (keterbacaan, struktur, kelengkapan) daripada pada penilaian substantif yang lebih dalam. Ini adalah temuan yang konsisten selama lebih dari 50 tahun penelitian penilaian otomatis (Ramesh & Sanampudi, 2022). Model AI menunjukkan bias yang terukur: bias posisi (sekitar 40% inkonsistensi dengan urutan yang diubah), bias verbositas (sekitar 15% inflasi skor untuk teks yang lebih panjang), dan bias penguatan diri (5 hingga 10% peningkatan untuk konten yang menyerupai data pelatihan).

Keterbatasan ini dapat dikelola melalui arsitektur tiga lapisan kami, mitigasi bias eksplisit dalam desain prompt, dan komunikasi transparan kepada pengguna tentang keandalan penilaian. Tujuannya bukan menggantikan penilaian manusia tetapi membuat keahlian evaluasi terstruktur dapat diakses oleh semua orang.

Bagian VI: Adaptasi B2B versus B2C

Model penilaian beradaptasi dengan konteks. Pengadaan B2B melibatkan 6 hingga 10 pemangku kepentingan dalam proses pengambilan keputusan yang panjang (Gartner, 2023), di mana risiko karier memperkuat kecenderungan menuju "tanpa keputusan." Keputusan B2C biasanya bersifat individual, lebih cepat, dan lebih didorong oleh emosi.

Adaptasi kunci:

Harga: proposal B2B mendapat manfaat dari angka bulat yang menyampaikan profesionalisme, kalkulasi ROI, dan analisis total biaya kepemilikan. Proposal B2C dapat memanfaatkan charm pricing (Poundstone, 2010) dan framing nilai emosional.

Bukti sosial: pembeli B2B menginginkan referensi rekan dan studi kasus dari organisasi yang sebanding (73% menggunakan studi kasus; Heinz Marketing, 2022). Pembeli B2C merespons volume ulasan, peringkat, dan endorsement influencer.

Pengambilan keputusan: proposal B2B harus secara simultan melayani beberapa peran dalam pusat pembelian. Proposal B2C menargetkan satu pengambil keputusan.

Kepercayaan: B2B menekankan sertifikasi, SLA, dan garansi institusional. B2C menekankan kebijakan pengembalian, garansi uang kembali, dan volume validasi sosial.

14 dimensi yang sama dievaluasi, tetapi bobotnya bergeser berdasarkan konteks. Ini memungkinkan AI menempatkan penekanan yang tepat untuk setiap proposal.

Kesimpulan

Kualitas proposal dapat diukur. Bukan sebagai opini, tetapi sebagai ilmu.

Literatur menawarkan hubungan konkret dan terkuantifikasi antara elemen proposal dan hasilnya. Model penilaian ini mengintegrasikan tiga disiplin ilmu yang jarang digabungkan: ekonomi perilaku (bagaimana presentasi harga dan framing memengaruhi penerimaan), ilmu persuasi (bagaimana kepercayaan, otoritas, dan bukti sosial membentuk evaluasi), dan NLP dan evaluasi AI (bagaimana sistem otomatis dapat mengukur konstruk ini secara andal).

Model ini langsung terhubung dengan bagian-bagian platform proposal.expert dan cukup fleksibel untuk berfungsi dengan format tetap (seperti RFP) juga.

Wawasan terpenting dari penelitian ini adalah apa yang kami sebut imperatif penilaian jalur ganda. Proposal secara simultan dievaluasi melalui analisis substantif dan melalui kesan intuitif, oleh orang-orang berbeda di tim pembelian. Proposal yang mendapat skor sempurna pada konten tetapi buruk pada presentasi kalah dari proposal yang melayani kedua jalur.

Wawasan itu dibangun ke dalam setiap aspek model penilaian kami. Dan sekarang tersedia bagi semua orang yang ingin menulis proposal yang lebih baik.

References

Aberdeen Group. (2018). The power of video in business: A benchmarking study. Aberdeen Group.

Adelie Studios. (2020). The state of video marketing 2020. Adelie Studios.

Ahmad, N., & Laroche, M. (2015). How do expressed emotions affect the helpfulness of a product review? Evidence from reviews using latent semantic analysis. International Journal of Electronic Commerce, 20(1), 76–111. https://doi.org/10.1080/10864415.2016.1061471

Arora, N., Ensslen, D., Fiedler, L., Liu, W. W., Robinson, K., Stein, E., & Schüler, G. (2021). The value of getting personalization right or wrong is multiplying. McKinsey & Company.

Baesler, E. J., & Burgoon, J. K. (1994). The temporal effects of story and statistical evidence on belief change. Communication Research, 21(5), 582–602. https://doi.org/10.1177/009365094021005002

Blankenship, K. L., & Holtgraves, T. (2005). The role of different markers of linguistic powerlessness in persuasion. Journal of Language and Social Psychology, 24(1), 3–24. https://doi.org/10.1177/0261927X04273034

Bornmann, L., Mutz, R., & Daniel, H.-D. (2010). A reliability-generalization study of journal peer reviews. PLOS ONE, 5(12), e14331. https://doi.org/10.1371/journal.pone.0014331

Burstein, J., & Chodorow, M. (1999). Automated essay scoring for nonnative English speakers. In Proceedings of the ACL99 Workshop on Computer-Mediated Language Assessment. Association for Computational Linguistics.

Chernev, A., Böckenholt, U., & Goodman, J. (2015). Choice overload: A conceptual review and meta-analysis. Journal of Consumer Psychology, 25(2), 333–358. https://doi.org/10.1016/j.jcps.2014.08.002

Cialdini, R. B. (2001). Influence: Science and practice (4th ed.). Allyn & Bacon.

Cialdini, R. B. (2021). Influence: The psychology of persuasion (New and expanded ed.). Harper Business.

Colquitt, J. A., Scott, B. A., & LePine, J. A. (2007). Trust, trustworthiness, and trust propensity. Journal of Applied Psychology, 92(4), 909–927. https://doi.org/10.1037/0021-9010.92.4.909

Conversion Fanatics. (2019). The impact of guarantee length on conversion rates: A split-test study. Conversion Fanatics.

Corporate Visions. (2022). The state of the conversation report. Corporate Visions.

Crist, B. (2022). Analyzing GAO protest decisions. Lohfeld Consulting Group White Paper.

Demand Gen Report. (2023). 2023 Content preferences survey report. Demand Gen Report.

Edelman. (2023). 2023 Edelman Trust Barometer. Edelman.

Fogg, B. J., et al. (2003). How do users evaluate the credibility of web sites? Proceedings of DUX 2003, 1–15. https://doi.org/10.1145/997078.997097

Forbes Insights & Google. (2018). The changing face of B2B marketing. Forbes Insights.

Freedman, J. L., & Fraser, S. C. (1966). Compliance without pressure: The foot-in-the-door technique. Journal of Personality and Social Psychology, 4(2), 195–202. https://doi.org/10.1037/h0023552

Freling, T. H., et al. (2020). When poignant stories outweigh cold hard facts: A meta-analysis. Organizational Behavior and Human Decision Processes, 160, 51–67. https://doi.org/10.1016/j.obhdp.2020.01.006

Gartner. (2023). The B2B buying journey. Gartner.

Goldstein, N. J., Cialdini, R. B., & Griskevicius, V. (2008). A room with a viewpoint. Journal of Consumer Research, 35(3), 472–482. https://doi.org/10.1086/586910

Guo, D., et al. (2020). Do you get the picture? A meta-analysis. AERA Open, 6(1), 1–20. https://doi.org/10.1177/2332858420901696

Heath, T. B., & Chatterjee, S. (1995). Asymmetric decoy effects on lower-quality versus higher-quality brands. Journal of Consumer Research, 22(3), 268–284. https://doi.org/10.1086/209449

Heinz Marketing. (2022). The state of B2B content consumption and demand report. Heinz Marketing.

Huber, J., Payne, J. W., & Puto, C. (1982). Adding asymmetrically dominated alternatives. Journal of Consumer Research, 9(1), 90–98. https://doi.org/10.1086/208899

Insivia. (2020). Video marketing statistics: The state of video in business. Insivia.

Iyengar, S. S., & Lepper, M. R. (2000). When choice is demotivating. Journal of Personality and Social Psychology, 79(6), 995–1006. https://doi.org/10.1037/0022-3514.79.6.995

Jarvenpaa, S. L., & Dickson, G. W. (1988). Graphics and managerial decision making. Communications of the ACM, 31(6), 764–774. https://doi.org/10.1145/62959.62971

Kahneman, D., & Tversky, A. (1979). Prospect theory. Econometrica, 47(2), 263–292. https://doi.org/10.2307/1914185

Kim, S., et al. (2024). Prometheus: Inducing fine-grained evaluation capability in language models. ICLR 2024.

Kitchen, P. J., et al. (2014). The elaboration likelihood model: Review, critique and research agenda. European Journal of Marketing, 48(11/12), 2033–2050. https://doi.org/10.1108/EJM-12-2011-0776

Kliestikova, J., et al. (2023). Warranty as a trust-building mechanism. Business, Management and Economics Engineering, 21(1), 1–18.

Knutson, B., et al. (2007). Neural predictors of purchases. Neuron, 53(1), 147–156. https://doi.org/10.1016/j.neuron.2006.11.010

Levin, I. P., Schneider, S. L., & Gaeth, G. J. (1998). All frames are not created equal. Organizational Behavior and Human Decision Processes, 76(2), 149–188. https://doi.org/10.1006/obhd.1998.2804

Li, Y., et al. (2021). Anchoring in economics: A meta-analysis. Journal of Behavioral and Experimental Economics, 90, 101629. https://doi.org/10.1016/j.socec.2020.101629

Lindgaard, G., et al. (2006). You have 50 milliseconds to make a good first impression! Behaviour & Information Technology, 25(2), 115–126. https://doi.org/10.1080/01449290500330448

Liu, Y., et al. (2023). G-Eval: NLG evaluation using GPT-4 with better human alignment. EMNLP 2023.

Lohfeld Consulting Group. (2022). Strength-Based Winning methodology. Lohfeld Consulting Group.

Loopio. (2025). 2025 RFP response benchmarks and trends report. Loopio.

Mayer, R. C., Davis, J. H., & Schoorman, F. D. (1995). An integrative model of organizational trust. Academy of Management Review, 20(3), 709–734. https://doi.org/10.5465/amr.1995.9508080335

McKinsey & Company. (2022). B2B Pulse Survey: The growing importance of pricing transparency. McKinsey & Company.

Messaris, P. (1997). Visual persuasion: The role of images in advertising. Sage Publications.

Moorthy, S., & Srinivasan, K. (1995). Signaling quality with a money-back guarantee. Marketing Science, 14(4), 442–466. https://doi.org/10.1287/mksc.14.4.442

Nelson, D. L., Reed, V. S., & Walling, J. R. (1976). Pictorial superiority effect. Journal of Experimental Psychology, 2(5), 523–528. https://doi.org/10.1037/0278-7393.2.5.523

Nesbit, J. C., & Adesope, O. O. (2006). Learning with concept and knowledge maps: A meta-analysis. Review of Educational Research, 76(3), 413–448. https://doi.org/10.3102/00346543076003413

Nielsen Norman Group. (2020). About Us pages: Best practices for establishing trust online. Nielsen Norman Group.

Nisbett, R. E., & Wilson, T. D. (1977). The halo effect. Journal of Personality and Social Psychology, 35(4), 250–256. https://doi.org/10.1037/0022-3514.35.4.250

Northcraft, G. B., & Neale, M. A. (1987). Experts, amateurs, and real estate. Organizational Behavior and Human Decision Processes, 39(1), 84–97. https://doi.org/10.1016/0749-5978(87)90046-X

Pack, A., & Maloney, J. (2024). Using GPT-4 for automated essay scoring in L2 writing. Computers and Education: Artificial Intelligence, 6, 100202. https://doi.org/10.1016/j.caeai.2024.100202

Parhankangas, A., & Ehrlich, M. (2014). How entrepreneurs seduce business angels. Journal of Business Venturing, 29(4), 543–564. https://doi.org/10.1016/j.jbusvent.2013.08.001

Pavlou, P. A., & Gefen, D. (2004). Building effective online marketplaces with institution-based trust. Information Systems Research, 15(1), 37–59. https://doi.org/10.1287/isre.1040.0015

Petty, R. E., & Cacioppo, J. T. (1986). Communication and persuasion: Central and peripheral routes. Springer-Verlag.

Poundstone, W. (2010). Priceless: The myth of fair value. Hill and Wang.

Prelec, D., & Loewenstein, G. (1998). The red and the black: Mental accounting of savings and debt. Marketing Science, 17(1), 4–28. https://doi.org/10.1287/mksc.17.1.4

Ramesh, D., & Sanampudi, S. K. (2022). An automated essay scoring systems: A systematic literature review. Artificial Intelligence Review, 55(3), 2495–2527. https://doi.org/10.1007/s10462-021-10068-2

Reinard, J. C. (1998). The persuasive effects of testimonial assertion evidence. In M. Allen & R. W. Preiss (Eds.), Persuasion: Advances through meta-analysis (pp. 69–86). Hampton Press.

Robinson, P. J., Faris, C. W., & Wind, Y. (1967). Industrial buying and creative marketing. Allyn & Bacon.

Seibert, J. (2018). Win rates and their determinants. Shipley Associates.

Seo, K. (2020). Meta-analysis on visual persuasion. Athens Journal of Mass Media and Communications, 6(3), 177–190. https://doi.org/10.30958/ajmmc.6-3-3

Shipley Associates. (2019). The Shipley proposal guide (4th ed.). Shipley Associates.

Simonson, I. (1989). Choice based on reasons. Journal of Consumer Research, 16(2), 158–174. https://doi.org/10.1086/209205

Simonson, I., & Tversky, A. (1992). Choice in context: Tradeoff contrast and extremeness aversion. Journal of Marketing Research, 29(3), 281–295. https://doi.org/10.1177/002224379202900301

Spiegel Research Center. (2017). How online reviews influence sales. Northwestern University.

Ta, V. P., et al. (2022). The language of persuasion. Journal of Computational Social Science, 5(1), 371–397. https://doi.org/10.1007/s42001-021-00144-w

Tran, T. P., Muldrow, A., & Ho, K. N. B. (2021). Understanding the role of personalization in B2B and B2C contexts. Psychology & Marketing, 38(12), 2196–2216. https://doi.org/10.1002/mar.21578

TrustRadius. (2025). 2025 B2B buying disconnect report. TrustRadius.

Tversky, A., & Kahneman, D. (1981). The framing of decisions. Science, 211(4481), 453–458. https://doi.org/10.1126/science.7455683

Vogel, D. R., et al. (1986). Persuasion and the role of visual presentation support. University of Minnesota.

Webster, F. E., Jr., & Wind, Y. (1972). A general model for understanding organizational buying behavior. Journal of Marketing, 36(2), 12–19. https://doi.org/10.1177/002224297203600204

Zheng, L., et al. (2023). Judging LLM-as-a-judge with MT-Bench and Chatbot Arena. NeurIPS 2023.