.

Foto: Una maqueta de una fuente de mapa de bits china realizada por la Fundación de Investigación de Artes Gráficas (GARF). Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford (EE. UU.)

Computación

Así se trasladaron miles de caracteres del chino a los ordenadores

1

Hace más de 40 años, los diseñadores dibujaron y editaron a mano sinogramas para teclear e imprimir en esta lengua. Los problemas de las escasas memorias de entonces, junto a otros de caligrafía, fueron protagonistas de aquel trabajo

  • por Tom Mullaney | traducido por Ana Milutinovic
  • 11 Junio, 2021

Bruce Rosenblum encendió su Apple II, que emitió la nota fa seguida por el sonido de la disquetera. Después de pulsar unas cuantas teclas, su monitor Sanyo de 12 pulgadas comenzó a fosforescer. Apareció una cuadrícula verde, de 16 unidades de ancho y 16 unidades de alto. Se trataba de Gridmaster, el software que Bruce había creado en el lenguaje de programación BASIC para formar una de las primeras fuentes digitales chinas del mundo. Estaba desarrollando la fuente para una máquina experimental denominada Sinotype III, que fue uno de los primeros ordenadores personales en manejar las entradas y salidas de datos en el idioma chino.

En ese momento, a finales de la década de los 70 y principios de la de los 80, los ordenadores personales no se fabricaban en China. Por eso, para hacer un PC 'chino', el equipo de Rosenblum reprogramaba un Apple II que operara en esta lengua. Su lista de tareas era larga: tenía que programar un sistema operativo desde cero, ya que el DOS 3.3 de Apple II no permitía la entrada y salida de textos en caracteres chinos; asimismo, tuvo que programar el propio procesador chino de textos, en lo que trabajó incansablemente durante meses.

Foto: La fotografía del monitor Sinotype III muestra el programa Gridmaster y el proceso de digitalización del carácter chino (dian, electricidad). Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

Si bien Gridmaster era un programa simple, la tarea para la que se iba a usar (crear mapas de bits digitales de miles de caracteres chinos) planteaba profundos desafíos de diseño. De hecho, para lanzar la fuente de Sinotype III, la máquina desarrollada por la Graphics Arts Research Foundation (GARF, Fundación de Investigación de Artes Gráficas) de Cambridge, Massachusetts (EE. UU.), se necesitó mucho más tiempo que para programar el ordenador en sí. Sin una fuente, no habría forma de mostrar los caracteres chinos en la pantalla o de imprimirlos en la impresora matricial de la máquina.

Para cada carácter chino, los diseñadores tuvieron que tomar 256 decisiones distintas, una para cada píxel posible en el mapa de bits (un mapa de bits es una forma de almacenar las imágenes digitalmente, ya sea como JPEG, GIF, BMP u otro formato de archivo, utilizando una cuadrícula de píxeles que juntos forman un símbolo o una imagen). Si esto se multiplica por miles de caracteres, el total asciende a literalmente cientos de miles de decisiones en un proceso de desarrollo que tardó más de dos años en completarse.

La programación de Gridmaster, que Rosenblum me describió a posteriori como "engorroso de usar, en el mejor de los casos", permitió a su padre, Louis Rosenblum, y a GARF asumir la responsabilidad de crear la fuente digital. Mediante cualquier máquina Apple II y ejecutando Gridmaster desde un disquete, se podían diseñar y guardar nuevos mapas de bits de caracteres chinos, de forma remota. Una vez creados y almacenados estos mapas de bits, los Rosenblum pudieron instalarlos en el Sinotype III usando un segundo programa (también diseñado por Bruce) que los introdujo, junto con sus códigos de entrada correspondientes, en la base de datos del sistema.

Sinotype III nunca se lanzó comercialmente. Sin embargo, el trabajo minucioso que se llevó a cabo en su desarrollo, incluido el de esta fuente china de mapa de bits, fue fundamental para un complejo esfuerzo global con el que resolver un desconcertante rompecabezas de ingeniería: cómo preparar un ordenador para manejar el chino, uno de los idiomas más utilizados en el mundo.

Foto: La fotografía de un monitor Sinotype III muestra la fuente de mapa de bits china. Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

Con la llegada de la computación y el procesamiento de textos en Occidente, los ingenieros y diseñadores determinaron que una fuente digital de baja resolución para inglés podría construirse sobre una cuadrícula de mapa de bits de 5 por 7, y requería solo cinco bytes de memoria por cada símbolo. Almacenar los 128 caracteres de baja resolución del código estándar estadounidense para el intercambio de información (ASCII, por sus siglas en inglés), que incluye todas las letras del alfabeto inglés, los números del 0 al 9 y los símbolos comunes de puntuación, requirió solo 640 bytes de memoria, una pequeña fracción de, por ejemplo, los 64 kilobytes de memoria integrada del Apple II.

Pero hay decenas de miles de caracteres chinos, y una cuadrícula de 5 por 7 era demasiado pequeña para hacerlos legibles. El chino requería una cuadrícula de 16 por 16 o más, es decir, al menos 32 bytes de memoria (256 bits) por carácter. Para una fuente que contenga 70.000 caracteres chinos de baja resolución, el requerimiento total de memoria excedería los dos megabytes. Incluso una fuente de solo 8.000 caracteres chinos de los más comunes requeriría aproximadamente 256 kilobytes solo para almacenar los mapas de bits. Eso era cuatro veces la capacidad de memoria total de la mayoría de los ordenadores personales disponibles a principios de los 80.

A pesar de lo graves que fueron estos desafíos de memoria, los problemas más difíciles a los que se enfrentaron en la producción de las fuentes chinas de baja resolución en los 70 y los 80 fueron los de estética y diseño. Mucho antes de que alguien se sentara con un programa como Gridmaster, la mayor parte del trabajo se realizaba fuera del ordenador, usando un lápiz, papel y el líquido corrector.

Los diseñadores pasaron años intentando crear mapas de bits que cumplieran con los requisitos de poca memoria y conservaran un mínimo de elegancia caligráfica. Entre los que crearon este conjunto de caracteres, ya sea dibujando a mano los borradores de mapas de bits para los caracteres chinos específicos o digitalizándolos con Gridmaster, estaban Lily Huan-Ming Ling (凌焕銘) y Ellen Di Giovanni.

Foto: Borradores de dibujos de mapa de bits de caracteres chinos para la fuente de Sinotype III. Créditos: Colección Louis Rosenblum, Colecciones especiales de la Biblioteca de la Universidad de Stanford

El problema central al que se enfrentaron los diseñadores fue traducir entre dos formas radicalmente diferentes de escribir en chino: el carácter dibujado a mano, con lápiz o pincel, y el glifo de mapa de bits, producido con una matriz de píxeles dispuestos en dos ejes. Los diseñadores tenían que decidir cómo iban a intentar recrear ciertas características ortográficas del chino escrito a mano (y si deberían hacerlo), como los trazos iniciales, la reducción de trazos y los finales.

En el caso de la fuente para Sinotype III, se documentó minuciosamente el proceso de diseño y digitalización de mapas de bits chinos de baja resolución. Una de las fuentes de archivo más fascinantes de este período es una carpeta llena de cuadrículas con marcas dibujadas a mano por todas partes, bocetos que luego se digitalizarían en mapas de bits para muchos miles de caracteres chinos. Cada uno de estos caracteres fue cuidadosamente diseñado y, en la mayoría de los casos, editado por Louis Rosenblum y GARF, utilizando el líquido corrector para borrar cualquier 'parte' con la que el editor no estuviera de acuerdo. Por encima del conjunto inicial de las marcas verdes, un segundo conjunto de marcas rojas indicaba el borrador 'final'. Fue entonces cuando comenzó el trabajo de la incorporación de los datos.

Foto: Un primer plano de un borrador de mapa de bits de bei (, 'revés', 'reverso') que muestra las ediciones realizadas con el líquido corrector. Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

Dada la gran cantidad de mapas de bits que el equipo tenía que diseñar, al menos 3000 (e idealmente muchos más) para que la máquina satisficiera las necesidades de los usuarios, se podría suponer que los diseñadores buscaron formas de optimizar su trabajo. Una forma en la que podrían haberlo hecho, por ejemplo, habría sido duplicando los radicales chinos, los componentes básicos de un carácter, cuando aparecían aproximadamente en el mismo lugar, con el mismo tamaño y orientación de un carácter a otro. Al producir las muchas docenas de caracteres chinos comunes que contienen el radical femenino (女), por ejemplo, el equipo de GARF podría haber creado (y, en teoría, debería haberlo hecho) solo un mapa de bits estándar y luego replicarlo dentro de cada carácter en el que aparecía ese radical.

Sin embargo, no se tomaron tales decisiones mecanicistas, como muestran los materiales de archivo. Por el contrario, Louis Rosenblum insistió en que los diseñadores ajustaran cada uno de estos componentes, a menudo de manera casi imperceptible, para asegurarse de que estuvieran en armonía con el carácter general en el que aparecían.

En los mapas de bits para juan (娟, 'elegante') y mian (娩, 'entregar'), por ejemplo, cada uno de los cuales contiene el radical femenino, ese radical se ha cambiado muy ligeramente. En juan, la parte central del radical femenino ocupa un espacio horizontal de seis píxeles, en comparación con los cinco píxeles del mian. Al mismo tiempo, en cambio, la curva inferior derecha del radical femenino se extiende hacia afuera solo un píxel más en el carácter mian, y en juan ese trazo no se extiende.

Foto: Los caracteres de mapa de bits para juan (, elegante) y mian (, entregar) de la fuente de Sinotype III, recreados por el autor. Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

En toda la fuente, este nivel de precisión fue más la regla que la excepción.

Si comparamos los borradores de los dibujos de mapa de bits con sus formas finales, vemos que se han hecho más cambios. En la versión borrador de luo (罗 'recolectar', 'red'), por ejemplo, el trazo inferior izquierdo se extiende hacia abajo en un ángulo perfecto de 45 ° antes de reducirse a la versión digitalizada de un trazo. En la versión final, sin embargo, la curva se aplanó y comienza a 45 grados, pero luego se seguía nivelando.

Foto: Una comparación de dos versiones de borrador de luo (, 'recolectar', 'red'). Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

En el espacio aparentemente pequeño en el que los diseñadores debían trabajar, tenían que hacer una cantidad asombrosa de elecciones. Y cada una de estas decisiones afectó todas las demás que tomaron para un carácter específico, ya que solo un píxel añadido cambiaba a menudo el equilibrio horizontal y vertical.

El implacable tamaño de la cuadrícula afectó el trabajo de los diseñadores de otras formas inesperadas. Esto se nota más claramente en el enorme problema de conseguir la simetría. Los diseños simétricos, que abundan en los caracteres chinos, fueron especialmente difíciles de representar en los marcos de baja resolución, porque, según las reglas de las matemáticas, crear simetría requiere zonas espaciales de tamaño impar. Las cuadrículas de mapa de bits con dimensiones pares (como la cuadrícula de 16 por 16) hicieron que la simetría fuera imposible. GARF logró la simetría, en muchos casos, utilizando solo una parte de la cuadrícula general: únicamente una región de 15 por 15 dentro de la cuadrícula general de 16 por 16. Esto redujo aún más la cantidad de espacio utilizable.

Foto: Simetría y asimetría en los caracteres shan (, 'montaje'), zhong (, 'medio'), ri (, 'sol') y tian (, 'campo'). Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

Todo se vuelve aún más complejo cuando comenzamos a comparar las fuentes de mapa de bits creadas por diferentes empresas o creadores para distintos proyectos. Por ejemplo, el radical de la palabra 'agua' (氵) tal y como apareció en la fuente de Sinotype III (abajo y a la derecha), a diferencia de otra fuente china temprana (a la izquierda), creada por el psicoterapeuta y emprendedor chino-estadounidense H. C. Tiene, que experimentó con la computación en chino en los 70 y los 80.

Foto: Una comparación del radical de la palabra 'agua' () tal y como apareció en la fuente de Sinotype III (a la derecha) versus una fuente china temprana creada por H. C. Tien (a la izquierda). Créditos: Colección Louis Rosenblum. Colecciones especiales de la Biblioteca de la Universidad de Stanford

Aunque parecen pequeñas las diferencias de los ejemplos anteriores, cada uno representaba otra decisión (entre miles) que el equipo de diseño de GARF tuvo que tomar, ya sea durante la fase de redacción o la de digitalización.

Por supuesto, la baja resolución no se mantuvo baja por mucho tiempo. Los avances informáticos dieron lugar a los mapas de bits cada vez más densos, velocidades de procesamiento cada vez más rápidas y costes de memoria cada vez más reducidos. En nuestra era actual de resolución 4K, pantallas Retina Display y demás, puede ser difícil apreciar el arte, tanto estético como técnico, que se utilizó en la creación de las primeras fuentes de mapa de bits chinas, por muy limitadas que fueran. Pero fue la resolución de problemas como este lo que hizo que la informática, los nuevos medios e internet fueran accesibles para una sexta parte de la población mundial.

Tom Mullaney es profesor de historia china en la Universidad de Stanford, miembro del Guggenheim y presidente de la cátedra Kluge deTecnología y Sociedad de la Biblioteca del Congreso de Estados Unidos. Es el autor o editor principal de seis libros, incluidos The Chinese Typewriter, Your Computer Is on Fire y el próximo The Chinese Computer, la primera historia completa de la informática en idioma chino.

Computación

Las máquinas cada vez más potentes están acelerando los avances científicos, los negocios y la vida.

  1. De dónde viene la crisis del ransomware y por qué es tan peligrosa

    Los ataques a las grandes empresas y a la infraestructura crítica han aterrorizado a EE. UU., pero las raíces del problema se remontan a varios años atrás. La administración Obama empezó a tratar un problema que se ha agravado a nivel mundial en los últimos años y del que los ciberdelincuentes acostumbran a salir indemnes

  2. La gravedad del ransomware sigue creciendo ante la inacción de Rusia

    El reciente ciberataque a un oleoducto de EE. UU. ha hecho saltar las alarmas entre la ciudadanía. Los expertos critican que Moscú hace la vista gorda con los ciberdelincuentes que operan desde su territorio y piden coordinación internacional y sanciones contundentes para evitar la expansión de este tipo de ciberdelitos

  3. Ciberescándalo: Google para un hackeo antiterrorista de un país aliado

    La empresa detectó que un grupo "experto" de hackers usaba 11 poderosas vulnerabilidades para comprometer dispositivos iOS, Android y Windows, y corrigió los fallos. Los atacantes resultaron ser agentes de inteligencia occidentales cuya misión quedó paralizada, lo que podría ponerles en peligro