Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Convert encoding HTML datoteka iz windows-1250 u UTF-8

[es] :: Visual Basic 6 :: Convert encoding HTML datoteka iz windows-1250 u UTF-8

[ Pregleda: 2387 | Odgovora: 10 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Convert encoding HTML datoteka iz windows-1250 u UTF-812.08.2015. u 16:21 - pre 39 meseci
Ne znam jesam li pogodio grupu foruma, pa molim moderatora da premjesti ako nisam.

Dakle, imam preko 1500 klasičnih *.html files (odrađenih u FrontPage/DreamWeaver koji imaju encoding windows-1250, želim sve files konvertirati u UTF-8
Ima li netko neku skriptu koja može konvertirati sve HTML datoteke u folderu i subfolderima u jednom potezu

Trenutna situacija je
- svi *.html files nalaze se na putanji C:\Temp\ i oni su HTML encoding "windows-1250" a poneki i "utf8". Folder C:\Temp sadrži subfoldere
- u svakom *.html file između <head>...</head> imam slijedeću liniju koda
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> (ali ne funkcionira)

Potrebno mi je slijedeće:

1. Skripta treba u svim files (u folderu i subfolders) pregledati sve files i bez obzira u kojem encodingu su da ih konvertira u UTF-8 (ja sam neke ručno jednu po jednu radio preko Noptepad++ ali to je zamarajuće i dugotrajno)
2. Nakon izvršenog konvertiranja encodinga u UTF-8, snimiti sve files

Ili možda se to može odraditi Notepad++ ali ja ne znam kako za sve files u folderu. Ako idem jedan po jedan file to nije problem, ali preko 1500 files već jeste

Može li netko pomoći: gotovom isprogramiranom VBS skriptom ili već bili kakvom, savjetom, linkom, iskustvom? Koristim Windows 7, tako da ne dolazi u obzir ideja sa programima za Linux.
 
Odgovor na temu

Jbyn4e

Član broj: 422
Poruke: 6049
95.180.71.*



Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-812.08.2015. u 22:25 - pre 39 meseci
Ovo deluje kao ono sto tebi treba:
http://www.elfdata.com/encodingmaster/

Mada bi ja radije instalirao Cygwin kao sto kazu ovde...:
http://superuser.com/questions...tch-convert-files-for-encoding

P.S. Imas tamo i powershell varijantu...
Kad sve ostalo zakaže, pročitaj uputstvo...
 
Odgovor na temu

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-813.08.2015. u 09:00 - pre 39 meseci
Citat:
Jbyn4e: Ovo deluje kao ono sto tebi treba:
http://www.elfdata.com/encodingmaster/

Hvala ti za javljanje. Jesi li koristio ovaj program, imaš li iskustva?

Citat:
Jbyn4e: Mada bi ja radije instalirao Cygwin kao sto kazu ovde...:
http://superuser.com/questions...tch-convert-files-for-encoding
Ovo sam već gledao i baš mi ne ide na ruku. Čitao sam za neke probleme na Win OS-u. A i upis raznih naredbi (sa kojima nisam na "ti") me odbijaju od ovakvih programa.

BTW: Tragam za opcijom u 'Notepad++' ili u 'UltraEdit' editorima ali izgleda da to nije moguće u njima. Eh, da je neka VBS skripta to bi bilo najbolje :)
Pokreneš VBS, upišeš source/destination path, vrstu encodinga from/to i završiš posao sa klikom, ali to je moguće samo za programere.
pozdrav
 
Odgovor na temu

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-813.08.2015. u 09:08 - pre 39 meseci
Citat:
Jbyn4e:
Ovo deluje kao ono sto tebi treba:
http://www.elfdata.com/encodingmaster/
Javlja error, traži da se kupi?
Odustao sam od njega.
 
Odgovor na temu

3okc
Χoᴘᴦoѡ

Član broj: 811
Poruke: 1275

Jabber: 3okc@elitesecurity.org


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-813.08.2015. u 09:38 - pre 39 meseci
Izgleda da makar jedan - ako ne i oba editora (Notepad++, UE) imaju plagin koji omogućuje traženu konverziju ali se nisam udubljivao.

Ovo sam usput izguglao i čini se da bi moralo da radi: Batch file conversion - character set and BOM detection of html files
Have you found helpful examples, solutions or ideas-in-work, please consider the
following:
• Citation of *actual page* you are going to using is welcome.
• Have you saw "Value Added" examples you are going to incorporate to your
profitable blog, daily job or any money making venture: How about online donation?
↗Ana & Vlade Divac Foundation
Hvala!
 
Odgovor na temu

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-813.08.2015. u 18:49 - pre 39 meseci
Citat:
3okc: Ovo sam usput izguglao i čini se da bi moralo da radi:
Hvala, pogledat ću, mada mi se ovako na prvu čini da trebam prvo proučiti što, gdje i kako s tom skriptom da bi radila ono što ja želim.

za ove plugine tragam ali za sada nisam naišao na prave ključne riječi
 
Odgovor na temu

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-814.08.2015. u 15:07 - pre 39 meseci
Probao sam neke programe. Ovaj je dobar ali samo za TXT files

Isprobao sam neke *.py skripte za Notepad++ ali nikako da ih prilagodim mojim potrebama. Ova mi se čini najbolja od svega što sam našao.
Ima li netko programerskog znanja da prepravi ovu skriptu. Folderi i subfolderi/*.html files mi se nalaze u C:\Temp
Gdje može biti greška. Notepad++ je verzija 6.8.1
Ovdje se konvertira u "UTF-8 without BOM" a meni treba "UTF-8".

Međutim, skripta ne radi uopće?
Kreirao sam Python/New Script i snimio.
Resetirao Notepad++ i pokrenuo skriptu, ali ništa se ne događa.

Code:

# Python script for bulk conversion of HTML and PHP files to UTF-8 without BOM using Notepad++
#
# @author Zion Ng <zion@intzone.com>
# @link [Source] https://github.com/zionsg/stan...-scripts/tree/master/CrawlSite
# @see http://notepad-plus-plus.org/ for Notepad++
# @see http://npppythonscript.sourceforge.net/ for PythonScript plugin for Notepad++
#
import os;
import sys;
# Modify path and extensions of files to convert here
path = 'C:\\Temp'
# path = 'C:\\Temp\\files'
extensions = ['.htm', '.html', '.php', '.phtml']
# Function to convert files in dir to UTF-8 without BOM using Notepad++
def processDirectory(args, dir, files):
console.write('Directory: ' + dir + "\r\n")
for file in files:
for extension in extensions:
if file[-len(extension):] == extension:
console.write(' ' + file + "\r\n")
notepad.open(dir + "\\" + file)
notepad.runMenuCommand('Encoding', 'Convert to UTF-8 without BOM')
notepad.save()
notepad.close()
break
# Run script
# processDirectory() will be called recursively for each directory encountered
os.path.walk(path, processDirectory, None)
console.write("\r\n" + 'DONE!' + "\r\n")
 
Odgovor na temu

Jbyn4e

Član broj: 422
Poruke: 6049
95.180.71.*



Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-814.08.2015. u 20:36 - pre 39 meseci
Tebi treba baš taj without BOM.

P.S. Nemam pojma kako se ovo pokreće, nisam koristio .py u notepad++, ali ima tamo gore u meniju "Run" pa probaj sa tim...
Kad sve ostalo zakaže, pročitaj uputstvo...
 
Odgovor na temu

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-815.08.2015. u 08:12 - pre 39 meseci
Citat:
Jbyn4e: Tebi treba baš taj without BOM
Možeš li mi objasniti zašto misliš da mi treba "...without BOM" a nije dovoljan samo UTF-8? Zanima me na što misliš, koja je razlika?

Kada u Notepad++ pojedinačno odradim 'convert to utf-8' sasvim je ok web stranica.

btw: odustao sam od python skripte. Morao sam dodatno instalirati PYTHON aplikaciju i štošta još podešavati u Notepad++ ali nije prošlo. Ništa se ne događa kada pokrenem raznorazne skripte, jednostavno konzola je prazna bez ikakvih događanja. Vjerojatno moje nedovoljno poznavanje rada sa programiranjem, skriptama i svim potrebnim aplikacijama i podešavanjima ima utjecaja.

Idem sada u drugom smjeru raznim drugim kombinacijama.
pozdrav
 
Odgovor na temu

Ivek33

Član broj: 66174
Poruke: 2736

Sajt: www.ic-ims.com


Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-815.08.2015. u 18:08 - pre 39 meseci
Riješio sam problem na drugačiji način
Za sve one koji imaju isti problem detaljan tutorijal korak po korak pogledajte na linku

- Konvertiranje encodinga windows-1250 u UTF-8
 
Odgovor na temu

Jbyn4e

Član broj: 422
Poruke: 6049
95.180.71.*



Profil

icon Re: Convert encoding HTML datoteka iz windows-1250 u UTF-802.09.2015. u 21:51 - pre 38 meseci
Citat:
Ivek33:
Citat:
Jbyn4e: Tebi treba baš taj without BOM
Možeš li mi objasniti zašto misliš da mi treba "...without BOM" a nije dovoljan samo UTF-8? Zanima me na što misliš, koja je razlika?

Nisam bio tu pa nisam primetio pitanje..

Dakle, kada ima BOM na početku UTF-8 enkodovanog fajla, a koristiš PHP i sesije, javljaće ti PHP grešku. Pisano je na forumu više puta dosad o tome pre par godina. Zaboravi na to zasad, rešio si problem.



Kad sve ostalo zakaže, pročitaj uputstvo...
 
Odgovor na temu

[es] :: Visual Basic 6 :: Convert encoding HTML datoteka iz windows-1250 u UTF-8

[ Pregleda: 2387 | Odgovora: 10 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.