Unicode: Bakom gardinen

Unicode Consortium firade sitt 25 -Ă„rsjubileum förra Ă„ret. Sanningen Ă€r att trots allt arbete Unicode gör för att sĂ€kerstĂ€lla text frĂ„n sprĂ„k runt om i vĂ€rlden – de flesta av oss kĂ€nner till Unicode som gruppen som godkĂ€nner nya emojis.
Det som kanske inte Ă€r sĂ„ tydligt Ă€r varför ett stort konsortium krĂ€vs eller den dolda komplexiteten hos Unicode. Eller hur krĂ€ksemojierna som visas i XCKD -tecknad film ovan betraktas redan som ”giltiga (men rekommenderas inte)”.

Mark Davis, medgrundare och dagens president för Unicode, har försökt klargöra hur emoji passar in i Unicode i denna högnivÄöversikt som ser pĂ„ vad Unicode Ă€r och hur Unicode Emoji-underkommittĂ©n (”Emoji SC”) passar in i Det.
Davis konstaterar att emojis utgör bara en brÄkdel av det totala antalet tecken i Unicode -standarden. Du kan knappt göra dem i detta diagram:

Tecken ensamma berÀttar inte halva historien. Ett antal glyfer mÄste kombineras nÀr de visas i vissa bestÀllningar eller kombinationer.

En kombination som kommer att vara bekant för mÄnga Àr hur emoji hudtoner implementeras.
Dessa fungerar genom att upptĂ€cka nĂ€r en modifierare karaktĂ€r visas efter mĂ€nsklig emoji, till exempel 👧 Girl. Dessa kombineras pĂ„ plattformar som stöds för att visa en enda emoji:

En mer komplicerad implementering innebÀr att gÄ med tvÄ eller flera emojis tillsammans till det som kallas en emoji ZWJ -sekvens.
Dessa anvĂ€nds för att skapa yrken som đŸ‘©â€âš– kvinnlig domare. Denna emoji skapas med hjĂ€lp av đŸ‘© -kvinnan och ⚖ Balance Scale Emojis i följd.
En ”ZWJ” (nollbredd snickare) stĂ„r mellan dessa tvĂ„ emojis och Ă€r ett osynligt lim som förenar flera emojis till ett (dĂ€r det stöds).

Andra typer av ZWJ -sekvenser listar en befintlig emoji sĂ„som đŸ•” detektiv med en könssymbol ♀ kvinnligt tecken tillagd efter det.
Denna typ av ZWJ -sekvens anvÀnds vanligtvis om en emoji redan finns. Till exempel: löpare, surfer eller mÄnga av gesterna.

Och ja, du kan kombinera modifierare och ZWJ: er för att skapa en lÀngre sekvens.

Unicode styr inte ZWJ -sekvenser pÄ samma sÀtt som nya emojis som krÀver sin egen kodpunkt.
Unicode rekommenderade sekvenser som bör stöds för konsistens över plattformar. Men leverantörer Àr gratis att kombinera alla emoji med nÄgon annan, som de anser.
Microsoft har sex ninja -katter tillgĂ€ngliga i Windows som inte Ă€r en del av Unicodes rekommenderade lista. đŸ± Cat Face och 🚀 Raket kombineras pĂ„ Windows 10 för att visa en emoji för đŸ±â€đŸš€ Astro Cat.
Astro Cat Àr giltig (eftersom den anvÀnder en korrekt sekvensstruktur) men rekommenderas inte som andra yrken och kön Àr.

XKCD föreslog att spy skulle vara en modifierare för att göra en ”krĂ€kande cowboy”.
Davis pĂ„pekar att đŸ€  Cowboy Hat Face redan kan kombineras med đŸ€ź ansikts krĂ€kningar för att skapa en giltig ZWJ -sekvens:

Andra sekvenstyper finns för emoji, inklusive flaggsekvenser, taggsekvenser och nyckelkapsekvenser. Du bör kolla in hela uppsÀttningen bilder för att se dessa mer detaljerat.
Slutligen, en titt pÄ (nuvarande, 2017) tidslinjen för hur en ny emoji föds:

🚹 Uppdatering april 2020: Den aktuella tidslinjen för hur en ny emoji Ă€r skapat har pĂ„verkats avsevĂ€rt av Covid-19-pandemin. Du kan lĂ€sa mer om det reviderade schemat för 2020 och dĂ€refter hĂ€r.
Naturligtvis har Unicode fortfarande mycket att göra utanför emoji -stöd:

”Det finns cirka 7 000 levande mĂ€nskliga sprĂ„k, med olika nivĂ„er av vitalitet. Mindre Ă€n 100 av dessa sprĂ„k Ă€r vĂ€l stödda pĂ„ datorer, mobiltelefoner och andra enheter, medan alla resten riskerar att vara digitalt missgynnade”

Unicode har ett antagande ett karaktÀrsprogram. Medel som samlas in frÄn adoptioner gÄr till forskning för att stödja dessa digitalt missgynnade sprÄk.
Mer:

Unicode emoji av Mark Davis
Unicode adoptera en karaktÀr
Nya emojis för 2017
Roliga emoji -hacks

Search Emojis: