Tim PaddlePaddle milik Baidu baru-baru ini merilis PP-OCRv6, sistem OCR baru yang menawarkan tiga versi: Tiny (1,5 juta parameter), Small (7,7 juta), dan Medium (34,5 juta). Model Medium memberikan peningkatan 4,6% dalam akurasi deteksi dan 5,1% dalam akurasi pengenalan dibandingkan PP-OCRv5, sekaligus mengintegrasikan bahasa Tionghoa, Inggris, Jepang, dan 46 bahasa berbasis alfabet Latin ke dalam satu model terpadu.
Sistem ini menggunakan teknik reparemeterisasi struktural untuk mengurangi beban komputasi sambil meningkatkan akurasi. Di bawah optimasi OpenVINO, versi Medium mencapai hingga 5,2x kecepatan inferensi CPU yang lebih cepat. Menurut tolok ukur resmi, PP-OCRv6 menyamai atau melampaui performa beberapa model visi-bahasa dengan parameter miliaran meski hanya memakai jutaan parameter. Kode tersebut telah diintegrasikan ke proyek open-source PaddleOCR.