AO3 News

Post Header

Published:
2018-12-13 19:55:35 -0500
Original:
The Archive now supports a whole lot more characters!
Tags:

🎁

Graças a uma atualização há muito planejada, o Archive of Our Own – AO3 (Nosso Próprio Arquivo) agora permite que você use em suas obras, comentários e perfil todos os emoji mais descolados, assim como uma lista de caracteres ampliada para vários idiomas (como alguns caracteres mais raros usados em japonês e chinês). 🎉🍾🎈🎊🎇De fato, todos os campos de texto agora suportam a coleção de caracteres UTF8MB4, exceto alguns que limitamos a caracteres latinos e algumas marcas de pontuação, como pseudos e nomes de coleção.

🔧

A codificação UTF8MB4 só se tornou disponível alguns anos após a criação do AO3, então nossa base de dados com a codificação antiga já tinha um tamanho considerável quando a atualização tornou-se inevitável. Depois de nossa recente melhoria dos servidores, que envolveu uma atualização ao MySQL 5.7, pessoas tentando publicar obras ou comentários usando caracteres não suportados (por exemplo, um dos emoji novos) encontraria uma página de erro em branco, piorando ainda mais esse problema.

Entretanto, migrar nossa base de dados inteira (617GB) seria uma árdua missão, sendo provavelmente necessário que o site ficasse fora do ar por vários dias. Felizmente, conseguimos bolar um plano para manter o site de pé o máximo possível, fazendo as mudanças em uma cópia vazia de uma tabela da base de dados enquanto a tabela “antiga” com todas os dados ainda estava em uso. Depois que cada nova tabela ficou pronta, copiamos os dados da tabela antiga para a nova, a colocamos em uso, e prosseguimos para a próxima tabela.

😱

Graças aos esforços assíduos de nosso administrador de sistemas voluntário, james_, completamos este trabalho em um pouco mais de uma semana, e sem perder dados! Contudo, encontramos um problema inesperado com as limitações que colocamos na base de dados para evitar a criação de tags com nomes idênticos.

Devido a uma mudança na maneira como os dados são comparados, alguns caracteres, como ss e ß, agora são tratados como idênticos. Isso significa que quando copiamos uma tag como "Weiss Kreuz" para o novo sistema, e pouco depois tentamos copiar "Weiß Kreuz", a segunda tag seria considerada uma duplicação e seria ignorada. Isso fez com que obras publicadas com a tag ficassem difíceis de encontrar, pois a tag não apareceria mais na obra.

Depois de descobrirmos e identificarmos o problema, pudemos usar um backup da base de dados para reconstruir as mudanças feitas até o momento da última troca, de modo que pudemos comparar as duas tabelas e recuperar as tags perdidas.

👍

Juntamente com o comitê de Organização de Tags, recolocamos todas as tags afetadas no sistema, então agora elas aparecerão novamente em suas obras. Se suas obras ou favoritos foram afetados por esse problema, desculpe!

Apesar de nossa atualização estar completa agora e nossa base de dados permitir todos estes caracteres novos, lembre-se que alguns dispositivos e navegadores, assim como leitores virtuais que dependem do formato MOBI, podem não exibir os caracteres corretamente. Ainda assim, esperamos que você curta as novas opções e envie mensagens ainda mais cheias de cor em seus comentários! ❤🧡💛💚💙💜