29.01.2024 в 17:47
Приложение: Переводчик комиксов, манги (pdf, jpg, cbr, ePub)
Существует множество автоматических переводчиков манги. Очень немногие должным образом поддерживают разноплановые комиксы других видов на других языках. Этот проект был создан, чтобы использовать возможности GPT-4 и переводить комиксы со всего мира. В настоящее время он поддерживает перевод с/на английский, корейский, японский, французский, упрощенный китайский, традиционный китайский, русский, немецкий, голландский, испанский и итальянский языки и обратно.
Ссылка на GitHub и инструкция по установке — по ссылке: https://github.com/ogkalu2/comic-translate
Приложение настроено таким образом, что самостоятельно очищает баблы (диалоги) от оригинального текста и добавляет перевод на очищенный фон.
Автоматическое определение участков для перевода
В настоящее время поддерживается использование GPT-4-Vision, GPT-4, GPT-3.5, DeepL и Google Translate. Во все модели GPT передается контекст всего текста страницы для облегчения перевода. GPT-4-Vision также предоставляет изображение страницы, страницу с исходным текстом для языков, которые он способен распознать (французский, русский, немецкий, голландский, испанский, итальянский) и нарисованное изображение для остальных.
Инструкция по установке
Python
Установите Python (<=3.10). Убедитесь, что во время установки вы отметили «Добавить python.exe в PATH».
Скачать с официального сайта: https://www.python.org/downloads/
В настоящее время приложение не полностью поддерживает Python 3.11 и выше из-за проблем с PaddleOCR. Если у вас нет намерения переводить с китайского с использованием опции по умолчанию (Paddle), вы можете использовать это с 3.11, заменив
paddleocr==2.7.0.3
paddlepaddle==2.5.2
на
PyMuPDF==1.23.8
в файле requirements.txt.
Клонируйте репозиторий (или скачайте папку), перейдите в папку
git clone github.com/ogkalu2/comic-translate
cd comic-translate
и установите все необходимые зависимости
pip install -r requirements.txt
Если у вас есть видеокарта NVIDIA, рекомендуется запустить
pip uninstall torch torchvision
pip install torch==2.1.0+cu121 -f download.pytorch.org/whl/torch_stable.htmlpip install torchvision==0.16.0+cu121 -f download.pytorch.org/whl/torch_stable.html
Примечание: 121 в +cu121 обозначает версию CUDA — 12.1. Замените 121 на вашу версию CUDA. Например, 118, если вы используете CUDA 11.8
Использование
В директории comic-translate запустите
python comic.py
Это запустит графический интерфейс
Советы
Импорт > Изображения для выбора одного или нескольких изображений. Если у вас есть файл CBR, вам потребуется установить Winrar или 7-Zip, а затем добавить папку, в которой он установлен (например, «C:\Program Files\WinRAR» для Windows), в путь. Если он установлен, но не в пути, вы можете получить ошибку
raise RarCannotExec(«Не удается найти рабочее средство»)
В случае ошибки инструкции для Windows, Linux, Mac
- Перейдите в Настройки > Текстовое отображение > Настройка текстовых блоков для настройки размеров блоков, используемых для отображения текста. Для ситуаций, когда текст отображается слишком большим или слишком маленьким. Это применит ко всем обнаруженным блокам на странице
- Убедитесь, что выбранный шрифт поддерживает символы целевого языка
Ключи API
Для следующих выборов потребуется доступ к закрытым ресурсам и, следовательно, ключам API:
- GPT-4-Vision, 4 или 3.5 для перевода (платный, около 0,02 доллара США за страницу для 4-Turbo)
- Переводчик DeepL (бесплатно для 500 000 символов в месяц)
- GPT-4-Vision для OCR (стандартный вариант для французского, русского, немецкого, голландского, испанского и итальянского) (платный, около 0,04 доллара США за страницу)
- Microsoft Azure Vision для OCR (бесплатно для 5000 изображений в месяц)
- Google Cloud Vision для OCR (бесплатно для 1000 изображений в месяц). Вы можете установить свои ключи API, перейдя в Настройки > Установить учетные данные
Получение ключей API
Open AI (GPT)
- Перейдите на веб-сайт платформы OpenAI по адресу platform.openai.com и войдите в систему (или создайте) с помощью учетной записи OpenAI.
- Проведите мышкой по правой панели страницы и выберите «Ключи API».
- Нажмите «Создать новый секретный ключ», чтобы сгенерировать новый ключ API. Скопируйте и сохраните его.
Google Cloud Vision
- Войдите в систему/создайте учетную запись Google Cloud. Перейдите в Cloud Resource Manager и нажмите «Создать проект». Установите имя проекта.
- Выберите свой проект здесь, затем выберите «Биллинг», затем «Создать учетную запись». В появившемся окне «Создать учетную запись», «Включить счет Google Cloud» и примите предложение о бесплатной пробной учетной записи. Ваш тип учетной записи должен быть индивидуальным. Введите действительную кредитную карту.
Включите Google Cloud Vision для своего проекта здесь
- На странице Google Cloud Credentials нажмите «Создать учетные данные» затем API Key. Скопируйте и сохраните его.
‹ Назад в блог
Следующая запись ›