AO3 News

Post Header

Published:
2018-12-13 19:58:59 -0500
Original:
The Archive now supports a whole lot more characters!
Tags:

🎁

Захваљујући дуго планираном ажурирању базе података, Archive of Our Own – AO3 (Наша сопствена архива) Вам сада нуди могућност коришћења свих најновијих емоџија, као и проширеног скупа карактера за неколико језика (као што су неки од ређе коришћених карактера у кинеском и јапанском језику) у вашим делима, коментарима, или профилу. 🎉🍾🎈🎊🎇. У ствари, сва текстуална поља сада подржавају UTF8MB4 скуп карактера, осим неколико поља као што су псеудоними или називи колекција, која су ограничена на употребу латиничних карактера и неколико знакова интерпункције.

🔧

UTF8MB4 кодирање је постало доступно неколико година након настанка AO3, тако да смо већ имали доста велику базу података користећи старије кодирање када је ажурирање постало неизбежно. Након нашег скоријег рада на серверима, који је укључивао и надоградњу MySQL 5.7, корисници који су пробали да објаве дело или поставе коментар са неподржаним карактерима (нпр. са једним од новијих емоџија) би добили празну страницу са грешком, што је додатно погоршавало проблем.

Ипак, мигрирање наше целокупне базе података од 617GB би био масиван подухват, вероватно захтевајући да систем буде недоступан неколико дана. Срећом, успели смо да дођемо до решења које нам је омогућило да ограничимо недоступност система на минимум тако што смо правили измене у новој, празној копији базе података, док је “стара” са свим подацима још увек била у употреби. Када је нова табела за базу била спремна, копирали смо податке из старе табеле у нову и покренули је, а затим поновили исти процес на следећој табели у бази.

😱

Захваљујући вредном труду нашег волонтера sysadmin james_, завршили смо овај посао за само мало више од недељу дана и без губитка података. Ипак, налетели смо на неочекивани проблем са једним од ограничења које смо поставили на базу како би спречили стварање више тагова са идентичним именима.

Услед промене у начину на који се подаци упоређују, неки карактери попут ss и ß се сада третирају као да су идентични. То значи да када смо копирали таг као што је "Weiss Kreuz" у нови систем, а затим пар секунди касније када смо покушали да копирамо таг "Weiß Kreuz," други таг је био идентификован као дупликат и једноставно је нестао. Дела која су била означена овим тагом су се због овога тешко налазила неколико дана, пошто се таг више није појављивао на делу.

Једном када смо идентификовали проблем и узрок, успели смо да искористимо резервне копије базе како бисмо реконструисали измене које су настале до тренутка када су базе коначно замењене, како бисмо могли да упоредимо две табеле и повратимо изгубљене тагове.

👍

Заједно са нашим уредницима тагова, вратили смо све тагове на које је ово имало ефекат назад у систем, тако да ће се они поново приказивати уз своја дела. Извињавамо се уколико је овај проблем утицао на Ваша дела или букмаркове!

Иако је ова надоградња сада довршена и база нам омогућава коришћење свих нових карактера, имајте на уму да их неки уређаји и претраживачи, као и апликације и е-читачи засновани на MOBI формату, можда неће правилно приказивати. Ипак, надамо се да ћете уживати у свим новим емоџијима и да ћете пружити екстра-шарену подршку ауторима у Вашим коментарима! ❤🧡💛💚💙💜