AO3 News

Post Header

Published:
2018-12-13 19:58:22 -0500
Original:
The Archive now supports a whole lot more characters!
Tags:

🎁

Graças a uma atualização há muito planeada à base de dados do Archive of Our Own – AO3 (O Nosso Próprio Arquivo), este agora permite que uses todos os emojis mais recentes e conjuntos alargados de caracteres para várias línguas (como alguns dos caracteres mais raros usados para as línguas chinesa e japonesa) nas tuas obras, comentários e perfil. 🎉🍾🎈🎊🎇. De facto, agora todas as caixas de texto suportam o conjunto de caracteres UTF8MB4, com a exceção de algumas que limitámos para que se usem apenas caracteres latinos e alguns sinais de pontuação, como pseudónimos ou nomes de colecção.

🔧

A codificação UTF8MB4 ficou disponível apenas alguns anos após a incepção do AO3, pelo que já tínhamos uma base de dados bastante grande que utilizava a codificação antiga quando a atualização se tornou inevitável. Depois do nosso trabalho recente nos servidores, que incluiu uma atualização para o MySQL 5.7, quem tentasse publicar uma obra ou um comentário com um caractere que não fosse suportado (p. ex. um dos emojis mais recentes) deparava-se com uma página de erro em branco pouco esclarecedora, o que piorava o problema.

No entanto, a migração de toda a nossa base de dados de 617GB seria um empreendimento massivo que poderia exigir vários dias de inatividade. Felizmente, fomos capazes de arranjar uma estratégia que nos permitiu minimizar o tempo de inatividade através da realização de mudanças a uma cópia nova e vazia de uma tabela de base de dados enquanto a tabela “antiga” ainda estava em uso. Assim que cada nova tabela estava pronta, copiávamos os dados para esta e avançávamos para a tabela seguinte.

😱

Graças aos esforços diligentes do nosso administrador de sistemas voluntário james_, concluímos esta tarefa em pouco mais de uma semana sem perder quaisquer dados. No entanto, deparámo-nos com um problema inesperado com uma das limitações que impusemos à nossa base de dados para evitar a criação de várias tags com nomes idênticos.

Devido a uma mudança na forma como os dados são comparados, alguns caracteres como ss e ß são considerados idênticos. Isto significa que quando copiámos uma tag como "Weiss Kreuz" para o sistema novo e, logo a seguir, tentámos copiar "Weiß Kreuz," a segunda tag era considerada um duplicado e descartada de forma discreta. Isto fez com que, durante alguns dias, obras publicadas originalmente com a tag descartada fossem difíceis de encontrar, pois a tag já não aparecia na obra.

Assim que descobrimos este problema e a sua causa, fomos capazes de utilizar uma cópia de segurança da base de dados para reconstruir as mudanças que tínhamos feito até à última troca, para que pudéssemos comparar as duas tabelas e restaurar as tags perdidas.

👍

Em conjunto com as nossas Pessoas Organizadoras de Tags, estamos de momento a reintroduzir as tags afetadas no sistema, o que fará com que apareçam novamente nas suas obras. Pedimos desculpa se as tuas obras ou favoritos foram afetados por este problema!

Apesar de esta atualização estar concluída e de a nossa base de dados permitir todos estes novos caracteres, tem em conta que alguns aparelhos e navegadores, bem como aplicações e e-readers que utilizem um formato MOBI, podem não mostrá-los corretamente. Ainda assim, esperamos que aproveites todas estas novas opções e que deixes comentários coloridos cheios de amor às pessoas criadoras! ❤🧡💛💚💙💜