Replacing invalid UTF-8 characters

Recentemente ho configurato rclone sul mio FreeNAS nuovo di zecca per effettuare il backup (sync schedulato con cron) dei miei spazi FTP.

Alcuni file però presentavano al loro interno dei caratteri non UTF-8 e così rclone alzava dei warning “Replacing invalid UTF-8 characters in <filename>“.

Ho voluto eliminare il problema e, grazie a Python, la soluzione è di una semplicità micidiale. Basta entrare via SSH nella directory in cui sono presenti i file con charset differente e dare:

python -c 'import os, re; [os.rename(i, unicode(i, "utf-8", "ignore")) for i in os.listdir(".")]'

Un ulteriore ls -A mostrerà la differenza. I punti interrogativi mostrati in precedenza al posto dei char fuori dal set dei caratteri saranno stati segati via.

Emanuele

Lascia un commento

I campi richiesti sono marcati con *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.