Pessoal, tenho um sistema de criar urls amigáveis e que são gravadas no banco de dados e depois em um arquivo sitemap.txt, a codificação das páginas estão como iso-8859-1 e estão salvas como ANSI, até aí tudo bem porque já testei em vários computadores o resultado da gravação e está gravando corretamente essas urls, mas uma coisa que me intriga é que ainda sim tem visitantes que clicam nos links e criam essas urls de forma errada, eu estive verificando no GoogleAnalytics que meu site recebe visitas do mundo inteiro e essas urls são gravadas na maioria quando é de madrugada aqui no Brasil, será que pode ser a codificação dos navegadores que visitam meu site? já testei até com Samrtfhone e outros celulares e está gravando certo, lembrando que o resultado é o mesmo usando codificação utf-8 e já usei até funções de codificação utf-8, segue abaixo como algumas urls estão sendo gravadas quando tem acentuação:
palaƒaƒa‚aƒaƒa‚a‚aƒaƒaƒa‚a‚aƒa‚a‚a¡cio-das-artes.html
palaƒaƒa‚aƒaƒa‚a‚a¡cio-das-artes.html
palaƒa¡cio-das-artes.html
pal¨¢cio-das-artes.html
palacio-das-artes.html
palácio das artes
s?o-louren?o-2003.html
sao-lourenco.html
são lourenço
com.-graaƒaƒa‚a§a-.html
com.-graca-e-paz.html
com. graça & paz
t?cnico-qu?mica-2012.html
tecnico-quimica.html
técnico química
padre-joi¿½o-botelho.html
padre-joaƒa£o-botelho.html
padre-joao-botelho.html
padre joão botelho
colaƒaƒa‚aƒaƒa‚a‚aƒaƒaƒa‚a‚aƒa‚a‚a©gio-staƒaƒa‚aƒaƒa‚a‚a‚aƒaƒa‚a‚aƒa‚a‚a.-antaƒaƒa‚aƒaƒa‚a‚aƒaƒaƒa‚a‚aƒa‚a‚a´nio.html
colaƒaƒa‚aƒaƒa‚a‚a©gio-staƒaƒa‚a‚aƒa‚a‚a.-antaƒaƒa‚aƒaƒa‚a‚a´nio.html
colaƒa©gio-sta‚a.-antaƒa´nio.html
colegio-st.-antonio.html
colégio St. antônio
com.-saƒaƒa‚aƒaƒa‚a‚aƒaƒaƒa‚a‚aƒa‚a‚a£o-lourenaƒaƒa‚aƒaƒa‚a‚aƒaƒaƒa‚a‚aƒa‚a‚a§o.html
com.-saƒaƒa‚aƒaƒa‚a‚a£o-lourenaƒaƒa‚aƒaƒa‚a‚a§o.html
com.-saƒa£o-lourenaƒa§o.html
com.-s?o-louren?o.html
si¿½o-loureni¿½o.html
com.-sao-lourenco.html
com. são lourenço
pit¨¢goras.html
pit?goras.html
pitaƒa¡goras.html
pitagoras.html
pitágoras
inf¨®rium.html
inforium.html
infórium
logos¨®fico.html
logosofico.html
logosófico
flecha-ve¨culos.html
flecha-veiculos.html
flecha veículos
vejam onde está de azul é o correto e que grava certo, para testar entre
no site e clique em algum link que tem acentos e verá que está tudo certo, é isso
que me intriga, existe variações para a mesma palavra, se alguém me der uma resposta
do porquê talvez eu possa encontrar um caminho mesmo que seja um replace completo
para caracteres ANSI que eu acho que pode ser a solução.