Bases Filosóficas da Organização da Informação

Miguel Angel Rendon Rojas

Pesquisador do Centro Universitário de Investigações Biblioteconômicas da Universidade Nacional Autônoma do México. Doutor em Filosofia.

Lizbeth Berenice Herrera Delgado

Licenciada en Biblioteconomia pela faculdade de Filosofia e Letras da Universidade Autonoma do México. Mestranda no Programa de Pós-Graduação em Biblioteconomia e Estudos da Informação na UNAM.

A ordem, como categoria filosófica, provém da filosofia grega e é um dos princípios da organização da informação. Analisamos a natureza da ordem, de sua origem e de sua presença nos sistemas da classificação da Ciência da Informação. Nós concluímos que esta ordem é introduzida pelo bibliotecário, mas sem consequencias subjetivistas ou relativistas. O “documentário cosmo” construído tem bases ontológicas objetivas procedentes do “ser informativo” do sujeito, por isso tem regularidades e características que podem ser estudadas objetivamente.

Palavras-Chave: Epistemologia da Ciência da Informação; Organização da Informação; Organização Bibliográfica; Ordem bibliográfica; Sistemas de Classificação; Ordem.

Ἐν ἀρχῇ ἦν ὁ Λόγος (no princípio era
o verbo/a palavra) João 1:1. *

Se um eterno viajante a atravessasse em qualquer direção, comprovaria depois de séculos que os mesmos volumes se repetem na mesma desordem (que, repetida, seria uma ordem: a Ordem). – J. L. Borges

A validade objetiva de todo conhecimento empírico repousa sobre isto e apenas isto: que a realidade é ordenada de acordo com as categorias, dado que são subjetivos, em um sentido específico. – M. Weber.

1 Introdução

O presente trabalho tem como objetivo fazer uma reflexão sobre os fundamentos filosóficos da ordem bibliográfica. Neste sentido, consideramos que as idéias e pressupostos desenvolvidos ao longo da história no âmbito da organização bibliográfica, não são independentes de outras manifestações culturais; pelo contrário, estamos convencidos que existem fortes vínculos entre o fazer bibliotecário e os desenvolvimentos e avanços na concepção do conhecimento. A partir desta abordagem, a justificativa deste trabalho consiste em tratar de mostrar que a organização é um dos princípios fundamentais que viabilizam a existência da biblioteca, pois garante a livre circulação social da informação, que leva a um melhor conhecimento da realidade. Além disso, nós pensamos a tarefa bibliotecária como um produto humano comprometido com a investigação científica e cultural, que não apenas tem suas raízes no conhecimento socialmente acumulado (e que sempre será um produto dos seres humanos); mas também está destinada a fornecer a qualquer pessoa que deseje, quando necessite, os conhecimentos e informações requeridos,  de forma ágil e prática.

Refletir sobre as bases filosóficas de organização da informação é voltar aos primórdios do mundo bibliotecário e seus construtores. Apenas basta lembrarmo-nos que a grande biblioteca da Antiguidade, a biblioteca de Alexandria, foi dirigida por grandes humanistas e cientistas [1], alguns dos quais eram filósofos, tradição a qual depois se uniriam através da história nomes como Casiodoro [2], Alcuino [3], Ockham [4], Leibniz [5], apenas para lembrar alguns. Também podemos lembrar que os princípios de classificação bibliográfica tiveram sua fonte em classificações das ciências criadas por diferentes filósofos.

Nessa linha de conexão entre as bibliotecas e a filosofia, Riaño Alonso diz que as bibliotecas na Grécia foram uma consequência direta do exercício e da prática da filosofia. Desta maneira a Biblioteca de Alexandria não nasceu apenas por capricho, ocorrência ou desejo de prestígio dos Ptolomeus, nem tinha como modelo os depósitos orientais das tábuas de argila, mas sua origem estava ligada a uma visão histórico-cultural concebida dentro das escolas filosóficas helenísticas (a Academia, o Liceu, a Estoa). A missão básica que lhe era conferida era criar e irradiar o clima político e cultural do Helenismo. É por isso que o modelo bibliotecário alexandrino, culminado pela figura de Calímaco de Cirene, teve tal êxito e se inseriu profundamente no paradigma bibliotecário, que se converteu no arquétipo dos centros bibliográficos que continuaram aparecendo no mundo grecorromano (RIAÑO ALONSO, 2005).

Nosso objetivo neste texto é mostrar que a categoria de “ordem” que cria o cosmos e a harmonia, está na base da organização bibliográfica, como seu fundamento último. Mas ao mesmo tempo que esta ordem é dada, não é dada a priori pelo objeto de maneira natural, mas a posteriori em função do sujeito de maneira artificial. O anterior não significa que essa realidade criada seja relativa e irreconhecível, mas humana; da mesma maneira que a linguagem e toda a cultura, que podem ser estudadas com metodologias e enfoques específicos (hermenêutica, pragmatismo, tipos ideais, construtivismo, teoria crítica, entre outros) e onde dificilmente se encontrarão leis que as expliquem, mas que podem ser conhecidas através de sentidos e significados que nos conduzem a sua compreensão.

Deve-se notar que utilizamos os termos ‘organização da informação’ e ‘organização bibliográfica’ de maneira distinta. Seu emprego corresponde à diferenciação que se faz no tempo e à evolução conceitual e terminológica que se estabelece em cada um dos períodos históricos. A conotação permanece sendo a mesma: em primeiro lugar a informação, como ente ideal (abstrato) mas ao mesmo tempo objetivizado (materializado) em documentos que podem ser de naturezas distintas; e em segundo lugar as formas de descrição, como se denomina e concebe na atualidade a matéria prima do fazer bibliotecário, esta informação objetivada.

2 No início era a ordem: o cosmos grego

Na cultura grega, que segue permeando nossa cultura contemporânea em política, filosofia, literatura, arte, linguagem entre outros aspectos, e também no problema que nos ocupa deste trabalho, nos ajuda a encontrar um elo para compreender o fundamento filosófico da organização bibliográfica. Este elo é a categoria de kosmos (κόσμος ou) que possuía um lugar central dentro da cosmovisão grega. O termo mencionado significa não apenas universo, mundo, céu, mas ao mesmo tempo, denota ordem, organização, disciplina. O anterior porque o universo era para os gregos frente a todo um universo ordenado, onde reinava a harmonia (lei, ordem, justa proporção). Antes do cosmos só havia o caos. Podemos lembrar o mito de Hesíodo da cosmogonia, onde o caos é o que existe antes de nada, mas depois deixa seu lugar a primeira e à segunda geração de deuses. Com o cosmos constituído não havia lugar para o caos, já que um e outro são antagônicos.

Essa ordem é presente na natureza, na arte, na conduta humana existe por que está regido pelo logos (Λόγος) que é Razão, lei, palavra, pensamento entre outros muitos significados. Um fragmento de Heráclito descreve essa cosmovisão grega onde reina a ordem, a harmonia, graças à direção de um logos: “Quando se escuta, não a mim, mas à Razão (logos), é sábio concordar que todas as coisas são uma” (HERÁCLITO, 1987).

A ordem regida pelo logos é necessária, já que o ser humano só pode viver e orientar-se em um mundo com ordem, como se adaptar as coisas à regra imposta pelo logos, se faz possível, “saber o que são as coisas agora e sempre, captar o que elas tem de eternas, o permanente em meio à mudança” (ZEA, 1993, p. 30-31). Mas ainda “na vida de cada indivíduo “ibris” (υβριξ εωξ) o excesso, ultrapassando o que é bom e adequado ao homem, traz consigo a queda e exige a correção, a volta ao equilibrio da balança, assim, por extensão ao universo, reina em tudo a lei cósmica, a conservação de um equilibrio que impede o caos e a anarquia” (COPLESTON, 1986, p. 36)

Também, durante o Medievo a idéia de um universo ordenado continuou, embora com roupagens teo-ontológicas. A cosmovisão medieval tinha agora como centro Deus e este passava a ser o ordenador, aquele que cria tudo perfeitamente; o logos grego deu seu lugar ao Deus medieval. Para Santo Agostinho e São Tomás a ordem é uma determinada relação recíproca das partes; é uma perfeição que aparece como subordinação do inferior ao superior, onde existe uma hierarquia ontológica.

Na filosofia da Idade Média podemos encontrar a harmonia do universo na doutrina tomista dos chamados transcendentes do ente, que são a unidade, a verdade, a bondade e a beleza. De acordo com esta idéia, todo ente é único, verdadeiro, bom e belo.

O ente é único por que em relação a seu ser não pode decompor-se em partes, o único que se opõe é o nada, e o nada não existe, é dizer  que o ente tem unidade em si mesmo (ou é, ou não é; mas como é, então é e ponto). Ao mesmo tempo, é não-contraditório (é e não pode ser) pode ser captado pelo intelecto e por isso é verdadeiro, apenas o ser é compreensível, o não-ser é inconcebível. A verdade se entende como a adequação do ser com o intelecto. Simultaneamente o ente como único e verdadeiro é captado pela vontade e é desejável, querido, nesse sentido é bom. A Bondade se concebe como a adequação do ser com a vontade. Finalmente, como verdadeiro e bom, o ente é belo.

Essa doutrina dos transcendentais nos mostra o otimismo e equilibrio do pensamento medieval. O mundo é criado por Deus e como este é não só onipotente mas tem todas as perfeições, entre elas a sabedoria e a bondade, portanto, esse mundo também é inteligível, bom e belo.

3 A ordem da modernidade: um olhar para a razão e o conhecimento

O mundo medieval deu lugar ao mundo moderno, isto significou uma mudança de cosmovisão onde o centro era Deus, garantia de harmonia no mundo natural, da possibilidade de conhecimento, da ordem política e social, da ética e da justiça; uma cosmovisão na qual a razão humana levantou-se com tais pretenções quase divinas. A modernidade se impôs à razão como garantia de ordem e harmonia. É por isso que se na antiga Grécia as reflexões giravam em torno de uma ontologia lógica; na Idade Média, em torno de uma ontologia teológica; na modernidade os olhares se voltaram para reflexões gnoseológicas, sobre o conhecimento, sobre como a razão conhece. Descartes, Leibniz, Bacon, Locke, Hume, Kant centram seus interesses primeiro no aspecto mais gnoseológico que ontológico pois tinham que fundamentar todo um modo de pensar de uma época, baseados na razão humana.

A transição da Idade Média para a Idade Moderna começa a acontecer a partir dos séculos XIV e XV com o movimento que se denominou Renascimento, mas se preparou quase um século antes com as lutas políticas entre o Papa e os Imperadores, levantamentos sociais disfarçados de heresias; mudanças ideológicas e filosóficas como o despertar, com Robert Grosseteste e Roger Bacon, de uma metodologia empírica e matemática. O desenvolvimento desta nova forma de investigação científica levou a um progresso vertiginoso da ciência, principalmente da Física e Astronomia, conhecido como revolução científica dos séculos XVI e XVII. Os nomes de Copérnico, Galileu, Tycho Brahe, Kepler e Newton estão ligados a essa revolução, produto de observações, experimentos, medições que levarão ao descobrimento de leis e regularidades.

Ao mesmo tempo que esses descobrimentos nas ciências particulares, se deu a fundamentação filosófica deste processo mediante à crítica aos conhecimentos medieviais, puramente especulativos, baseados no escrito de textos de certos autores, reconhecidos como autoridades (Aristóteles, Tomás de Aquino, Padres da Igreja, Bíblia) sem se tornar uma realidade, através da justificação da metodologia empírica, indutiva e matemática; assim como na ênfase do valor prático do conhecimento frente ao meramente contemplativo.

Nesta linha cabe ressaltar os pensamentos de Descartes, reconhecido como o pai do pensamento moderno, e de Francis Bacon, filósofo do método indutivo experimental. Ambos pensadores criticam o conhecimento medieval, Descartes com sua conhecida dúvida metódica “não aceitar nada como verdadeiro, antes de se obter evidência de que seja assim”; e Bacon com sua crítica aos ídolos ou prejuízos que impedem chegar ao conhecimento, os ídolos da tribo (idola tribus), próprios da espécie humana que tende a ver ordem e causas universais; os ídolos da caverna (idola specus) próprios da individualidade, que por gostos, interesses, educação introduzem subjetividade na visão do mundo; os ídolos de mercado (idola fori), que aparecem pelo contato entre os homens e problemas de linguagem, causam confusões, já que “quando os conceitos faltam, os suprem oportunamente as palavras”; e os ídolos do teatro (idola Theatri) que são os erros causados por pseudocientíficos que como atores proclamam suas falsas teorias em escolas ou universidades.

Em respeito ao método que posam estes filósofos, Descartes depois de sair de sua dúvida metódica ao encontrar a verdade “clara e evidente” no princípio de cogito ergo sum, volta o olhar para a matemática como modelo de conhecimento, por que proporciona a necessidade, evidência e clareza em seus conhecimentos buscados. Desta maneira, como disse Galileu, as matemáticas são a linguagem própria da natureza e portanto o método para investigá-la, sem sua ajuda resulta como impossível compreender uma palavra da natureza.

Por sua parte, Francis Bacon propõe uma rejeição da lógica aristotélica, que equivalia a silogística, como um método inadequado para a investigação científica, e  salienta a necessidade de encontrar um novo método de investigação da natureza. Por isso denomina sua obra como Novum Organum já que a obra lógica de Aristóteles se conhece como Organon. Bacon fundamentou o indutivismo como um método experimental. Para ele era necessário reorientar a ciência de sua época com a natureza e os fatos, bem como o uso de uma metodologia que consistiu em uma observação cuidadosa e completa dos fatos, que chama <<história natural e experimental>> realizada de acordo com tabelas de presença, ausência e comparação ou graus.

Outra característica que o pensamento moderno concedeu ao saber científico é a utilidade prática do conhecimento teórico. Principalmente Bacon estabelece a estreita relação entre a ciência e o domínio da natureza. “Conhecimento é poder” por que proporciona aos seres humanos a possibilidade de manipular a realidade de acordo com o seu desejo, e claro, a vontade se considera boa. Ela deve estar sob o controle do intelecto. Desta maneira se abrem os horizontes do progresso humano impulsionado pelo desenvolvimento científico.

Dentro deste contexto onde tudo gira ao redor da problemática gnoseológica, o interesse também se centralizou na classificação da ciência. Embora a classificação da ciência seja um tema específicamente moderno, desde a antiga Grécia com Aristóteles encontramos a preocupação de estabelecer uma divisão do conhecimento filosófico. Segundo o Estagirita, a filosofia se divide em teórica, onde se busca a verdade; prática, onde se estuda a ação dirigida a um objetivo; e poética, onde o objeto exterior é produzido por um agente. A lógica é classificada como um instrumento (organon). Posteriormente na Idade Média a classificação das ciências aparece ligada a educação que se ensinava nessa época e que incluía o ensinamento das então chamadas sete artes liberais (próprias dos homens livres e que se opunham às artes manuais). Tais artes liberais se dividiam no Trivium (Gramática, Dialética, Retórica) e no Quadrivium (Aritmética, Geometria, Astronomia, Música).

Para Descartes o conhecimento científico se divide em forma de árvore, onde a raiz é a Filosofia, o tronco a Física; os ramos são a Linguística, a Economia, a Medicina, o Direito, a Astronomia, a Geometria e a Ética.

Para Francis Bacon, as ciências se classificam segundo as faculdades do homem: razão, memória e imaginação. A cada uma destas faculdades correspondem algumas disciplinas:

historico-razc3a3o

Esta classificação se tornou muito importante por que serviu como base para o sistema de classificação de M. Dewey.

Outro grande pensador da modernidade foi Leibniz, que concebe as ciências como um continuum, cujas divisões são arbitrárias e só admissíveis por comodidade. Em sua obra Novos ensaios sobre o entendimento humano Leibniz expressa a idéia de que o corpo inteiro das ciências pode ser considerado como o oceano, que é contínuo por todas as partes e sem interrupções, embora os homens possam conceber linhas e nomeações à sua comodidade. Neste continuum as ciências são equipotentes e podem se organizar de várias maneiras, segundo a função que ocupem no todo ou segundo outros critérios materiais ou formais. Leibniz deixou não menos de vinte classificações das ciências (LEIBNIZ, 1764, p. 247-250).

A idéia de que não existe uma “ordem natural” na classificação das ciências também é importante em nossa análise por que como veremos mais adiante, a ordem dada ao conhecimento científico é concedida pelo classificador, questão que Borges colocaria em evidência em seu “Torre de Babel”, onde “os mesmos volumes se repetem na mesma desordem (que, repetida, seria uma ordem: a Ordem)”.

Durante o Iluminismo as idéias de Bacon influenciaram a estrutura e a ordem que recebeu a Enciclopédie ou Dictionaire raisonné des sciences, des arts et des métiers [Dicionário fundamentado das ciências, das artes e dos ofícios]. Efetivamente, D’Lambert e Diderot, seguiram o projeto baconiano, pois deram a sua obra uma seção de história, outro para a filosofia e uma terceira para as belas artes. Assim, cada um destes grandes grupos de ciências e atividades humanas se subdividiu em muitas outras seções que configuram a árvore <<das ciências, das artes e dos ofícios>>. Adicionalmente, a diferença entre as enciclopédias antigas (a Historia natural, de Plínio, O velho, as Etimologías de São Isidoro, as Sumas dos escolásticos cristãos) e as modernas está em que aquelas, tentam conservar os conhecimentos de uma época; e estas, difundi-los [6]. Visto assim, a enciclopédia se apresentou como um sistema de todos os conhecimentos humanos; quando estes são ilimitados, busca-se uma maneira de representá-los em síntese.

O modelo científico desenvolvido na modernidade foi o das ciências naturais por que como já indicamos, foram a Física e a Astronomia nos séculos XVI e XVII as que se desenvolveram de maneira vertiginosa. Em seguida foi a vez da Química no século XVIII e a Biologia no século XIX, para que finalmente no século XX se realizasse uma revolução em todas as ciências naturais e nas tecnologias, destacando-se o desenvolvimento da computação, telecomunicações e genética. Desta maneira, tendo como modelo da ciência as ciências naturais, nasceu o positivismo, que exaltava o uso do método científico empírico, matemático e lógico para descobrir leis gerais que permitiram explicar e predizer a realidade.

Foi até o século XIX, com exceção do pensamento de G. Vico no século XVIII, que as Ciências Sociais e Humanas levantaram a mão para que fossem tidas em conta como um corpo de conhecimentos distinto ao das ciências naturais. Desta maneira para os neokantianos W. Windelband se distinguem as ciências nomotéticas (que descobrem leis) e as idiográficas (que buscam sentidos), e para H. Rickert esta distinção equivale às ciências naturais e às ciências da cultura. De maneira semelhante, W. Dilthey divide as ciências naturais, que pretendem explicar e seguem o modelo positivista, das ciências do espírito, que tendem a compreender e cujo método é a hermenêutica (interpretação para chegar ao sentidos das ações).

4 A pós-modernidade e o advento do caos

Foi dentro deste contexto onde aparaceu um novo movimento que se tem denominado pós-modernidade. Em efeito, devido ao desenvolvimento das ciências sociais e humanas; uma decepção para chegar a um conhecimento universalmente verdadeiro [7]; ao desencanto pelas promessas não cumpridas baseadas no poder da razão [8], o projeto da modernidade cambaleou e surgiu outra visão alternativa: a pós-modernidade, a qual em sua vez, também afetou o modo de organizar o conhecimento.

É muito difícil definir um fenômeno tão complexo que abarca múltiplos pensadores e esferas da cultura como a pósmodernidade. Abordaremos este problema seguindo Habermas (1989, p. 69; 1988, p. 19-36) e Beuchot (1996) que tomam como ponto de partida para sua análise das diferentes escolas posmodernas a posição que se adota frente à razão e ao ideal do Iluminismo. De acordo com este critério, segundo Habermas se pode criticar a modernidade a partir da esquerda ou direita. Em ambos os casos se aceita algo do projeto da modernidade. Mas também podemos criticá-la negando-a totalmente.

No caso da crítica à modernidade a partir da esquerda, por um lado se aceitam algumas de suas realizações, mas por outro, também se deseja superar a razão meramente instrumental com outro tipo de razão, seja através da ação comunicativa (Habermas), a hermenêutica (Gadamer), ou a pragmática (Appel). Por sua parte, os críticos da direita ou neoconservadores, aceitam a técnica, a razão instrumental; mas rechaçam a cultura, a razão ética-utópica. Entre estes encontramos C. Schmitt, Gottfried Benn, Arnold Gehlen, Daniel Bell. Finalmente, encontramos aos que negam por completo a modernidade e são críticos radicais da razão; são os chamados antimodernos, e alguns de seus representantes são o “segundo” Heidegger, J. Derridá, G. Bataille, G. Deleuze, M. Foucault, F. Lyotard, G. Vattimo, R. Rorty. Nesta mesma linha de negar a modernidade mas com a proposta de voltar a posições anteriores à modernidade como o neoaristotelismo se encontram alguns pensadores que são conhecidos como paleoconservadores ou prémodernos, entros os que podemos enumerar L. Strauss, R. Spaeman, A. MacIntyre; H. Jonas e S. Hauerwas. (BEUCHOT, 1996, p. 9)

A pósmodernidade alcança o problema da organização do conhecimento em dois aspectos; o primeiro enquanto se pode ver o sonho da sociedade da informação o conhecimento como uma vertente pós-moderna de direita, e segundo como a introdução do relativismo, subjetivismo e certa “desordem” na organização (uso de linguagem livre, lógicas difusas) como influência de uma posmodernidade antimoderna.

5 Biblioteconomia Contemporânea

Embora tenhamos visto que a prática bibliotecária data da antiguidade e da idade média, é na idade moderna que se toma consciência desta prática e ela finalmente se constitui como disciplina independente. Não é de se estranhar que o primeiro manual conhecido de biblioteconomia, obra de Gabriel Naudé Advis pour dresser une bibliothèque fora publicado no século XVII, que a criação dos sistemas de classificação apareceram no século XIX, M. Dewey se inspirou na classificação das ciências de Bacon, e a Biblioteconomia nasceu sob o modelo positivista da ciência. Todas essas circunstâncias são um reflexo de que esta disciplina é uma ciência eminentemente moderna, é produto da modernidade.

De fato, se considerarmos alguns dos valores que mais se apreciam em biblioteconomia: o universalismo para resumir todo o saber humano; o ideal do Iluminismo que prega que o conhecimento e a verdade costumavam ser melhores; a preocupação com a normalização, a organização e a sistematização; então descobrimos que esses mesmos valores são distintivos e característicos da modernidade.

Levando em consideração todo o enunciado anterior, podemos afirmar que na biblioteconomia rege o princípio da ordem, já que se respeitam os conceitos de organização, hierarquia e prioridade, posteridade e sucessão, assim como a estrita observância do conjunto padrão e sua relação recíproca. O sustentar a organização documental nas relações de documentos, seus conteúdos e a representação simbólica que os localiza e agrupa, permite que se integrem coleções documentais que façam explícito o significado de tais relações, criando um núcleo de conhecimentos acerca dos documentos que conformam a coleção, obtendo sua relevância dentro da mesma organização.

Isso leva o bibliotecário ao reconhecimento da necessidade de utilizar a classificação como ferramenta de organização. A tradução da classificação como uma regra resulta no sistema de classificação no qual a representação documental é constituída e dirigida pela atribuição e emprego de símbolos. Então, o sistema classificador tem como finalidade, servir na ordenação dos documentos mediante relações de interpretação que implicam um processo dirigido a, por um lado representar o documento e por outro dotá-lo de significado, com o qual se pretende dar coerência à diversidade documental, com o objetivo de explicar os vínculos existentes entre os documentos que formam parte da coleção.

Graças ao sistema de classificação se organiza o conhecimento em taxonomias ou categorias. As taxonomias representam mecanismos construídos para classificar as coisas em uma série de grupos hierárquicos cuja função é facilitar a identificação, estudo e localização; assim como também permite a inclusão de estruturas e aplicações. As estruturas são centradas nos termos e suas relações, e as aplicações são as ferramentas que facilitam o seu uso. Atualmente isto se traduz no processo que inicia-se com análise documental, orientado pelas regras de catalogação e os sistemas de classificação documental que pretendem obter e oferecer representações do documento, seu conteúdo e todas as possíveis relações existentes.

A classificação na biblioteconomia contida em um catálogo, tem como finalidade definir um universo cuja primeira instância permita determinar se um registro em particular pode incluir-se ou não como parte do universo de documentos, além de criar um espaço onde se estabelecem relações lógicas entre os elementos dos registros pertencentes a este universo e sirva de base para a organização física dos documentos e suas representações.

Assim como a organização física dos documentos tem lugar, encontramos a organização temática ou de conteúdo, a qual para ser visível, manipulável e organizável desenvolve o registro documental. Tal registro se baseia nos princípios de catalogação, tarefa na qual se descreve os elementos físicos e temáticos que caracterizam um documento, nomear cada uma das partes que os constitui e estabelecer a ordem que deve guardar dentro de tal registro. A ordem e as relações entre os elementos de um registro, dotam o documento de significado, sua informação e conteúdo, o que permite a relação dos elementos entre registros.

Agora a reunião de múltiplos registros dão como resultado a existência do catálogo, que em sua estrutura global, manifesta as relações entre registros documentais, documentos, agrupamento e localização espacial; fazendo evidente sua própria forma de ordenação que é guiada pela normalização em seu contínuo crescimento e reflete a ordem bibliográfico-documental da biblioteca.

Assim, o núcleo de conhecimentos se verá representado pelo catálogo da biblioteca, no qual se observa a conjunção dos três tipos de ordem até agora desenvolvidos – físico, temático e de registro -, que o convertem à porta de acesso à informação contida nos documentos organizados no acervo.

Embora em nossos dias ainda os grandes sistemas de classificação e as normas catalográficas, que inicialmente foram adotadas como resposta à sobrecarga de informação gerada devido ao descobrimento da imprensa, seguem resolvendo os problemas de arranjo temático dos documentos, e podem seguir sendo considerados como eficientes instrumentos de sistematização dos conteúdos documentais e de conhecimento, atualmente existem outras propostas para identificar, representar e ter acesso aos documentos, principalmente devido a aparição de documentos eletrônicos. Por exemplo o modelo proposto pelo Dublin Core para metadados e os alinhamentos de descrição de dados no RDA, no FRBR. No entanto não é difícil constatar que o princípio e categoria da ordem segue mantendo-se nessas novas propostas.

6 Considerações Finais

A análise do que foi aqui exposto nos permite afirmar que há semelhança do mito de Hesíodo sobre a teogonia, o caos informacional dá seu lugar ao “cosmos documental”, onde rege uma ordem, graças a qual é possível orientar-se, mover-se e atuar neste cosmos. A particularidade disso que temos denominado cosmos documental é que é construído pela atividade do bibliotecário, é pois uma criação humana e por consequencia cultural. Em outros escritos temos identificado o sistema de organização documental como objeto de estudo da biblioteconomia (RENDÓN ROJAS, 2005) e conectando esta idéia com esta reflexão sobre as bases da organização documental, podemos dizer que o bibliotecário com sua ação constrói este sistema; o qual não é um ente natural dado (pedra, planeta, elemento químico por exemplo) para o qual devemos interpretar para dotá-lo de sentido; mas mesmo incluso sua mesma existência é imediata.

O nomear (representar) o ente informativo-documental, é criar uma organização e realizar o necessário para fornecer o acesso a este, é construir o mundo informativo documental próprio da biblioteconomia; um mundo como todo o humano, cheio de sentido, mas sentidos de segunda ordem, ou seja, sentidos do mundo natural, mas sentidos de um mundo cultural que por sua vez é interpretado. Por isso a biblioteconomia não é uma ciência natural, mas seguindo a terminologia de Dilthey, uma ciência do espírito.

Se tomamos por exemplo a classificação que se realiza na organização documental, encontramos que a classificação é uma operação lógica realizada com conceitos [12] que são divididos coerentemente, com base em certos critérios, o volume do conceito inicial mediante a formação de subclasses ou subconjuntos sucessivos. Tais critérios podem ser propriedades inerentes ao objeto, presentes como características essenciais; ou podem ser características que por si mesmas não são relevantes para o objeto em si, mas que se empregam como critérios para realizar uma determinada tarefa. No primeiro caso, se pode dizer que é uma classificação natural baseada em atributos essenciais dos objetos, como é o caso da classificação dos elementos de acordo com a Tabela Periódica de Mendeleiev, onde o peso e número atômico determinam o lugar e propriedades dos elementos; ou as classificações taxonomicas dos seres vivos na biologia, onde a anatomia comparada e a evolução das espécies orientam a classificação. No segundo caso, os critérios da classificação se baseiam em características que se escolhem por que são convenientes para alcançar um fim, como seria classificar alunos por estatura, peso, ou as palavras por ordem alfabética. Neste último caso temos classificações artificiais.

O ato de criar um mundo informativo documental artificial, com classificações arbitrárias, tem levado a pensar, dentro do contexto posmodernista, onde na biblioteca e em seu cosmos reina a subjetividade total, a arbitrariedade absoluta. Mas devemos deixar claro que o artificial se contrapõe ao natural, no sentido de sua gênese, depende da ação de um sujeito o natural não; mas não é sinônimo de relativismo e incapacidade de ser estudado e conhecido. Em primeiro lugar, o sistema criado tem suas regularidades enquanto ente existente. Em segundo lugar, a mesma construção do sistema informativo documental não é uma criação ex nihilo, mas é precisamente uma construção que utiliza matéria prima inicial; e essa matéria prima: informação, documentos, usuários posuem umas características que são os suportes que dão objetividade à ordem criada. Toda interpretação, embora dependa do sujeito, deve respeitar o texto, neste caso essa matéria prima da qual falamos linhas acima. O atributo de ser uma realidade objetiva e necessária é o que temos chamado “fundamentação ontológica da biblioteconomia”, a qual temos desenvolvido previamente (RENDÓN ROJAS, 2005, p. 54-78) e consequentemente demonstrou que o cosmos biblioteconomico possui sua ontologia própria, abstrata e humana; e ao mesmo tempo não é algo inventado por um voluntarismo absoluto, mas repousa em uma ontologia de primeiro nível, ancorado em características reais do ser humano, que englobamos com o termo “ser informacional”, já que o ser humano por sua estrutura ontológica para realizar seu ser necessita criar, consumir, transformar informação como um ser dialógico, hermenêutico, histórico, simbólico, político, social, econômico, racional.

Desta maneira, se queremos seguir com a metáfora da teogonia hesiódica, podemos concluir que no princípio é o ser informacional, disto nasce o cosmos documental regido pela ordem, nascimento mediado pela atividade do sujeito; e finalmente, essa ordem possui suas próprias regularidades, que podem ser estudadas.

___________________________

* No princípio era o ‘logos’. Frase com que se inicía o Evangelho de São João que resume a cosmovião da Antiguidade. Para o pensamento grego o logos se entendia como palavra, linguagem, pensamento, mas também é razão, lei, regra, principio racional, razão suprema, conformidade com a lei, princípio que impõe ordem,…

[1] Demetrio de Falero, Calímaco de Cirene, Zenódoto de Éfeso, Apolonio de Rodas, Eratóstenes, Aristófanes de Bizancio, Aristarco de Samotracia, Apolonio Eidographos.

[2] Junto com Boécio e Isidoro de Sevilha é considerado um dos fundadores intelectuais do pensamento medieval. No início do século VI funda o monastério de Vivaruim e com suas obras De Institutione divinarum literarum e De Ortographia elabora um programa para que os monges de seu monastério se dediquem à leitura e cópia de textos “para servir à Deus”. O Vivarium desapareceu sem deixar vestígios, mas as ordens monásticas posteriores continuaram este projeto, dando assim lugar a uma das instituições medievais mais importantes: as bibliotecas monásticas com seus copistas (GONZÁLEZ CASTRILLO, 2002, p. 102-103).

[3] Clérigo de origem inglesa, conselheiro de Carlos Magno e propulsor das reformas em educação e cultura em geral no chamado renascimento carolíngio. Ao final de sua vida  montou uma importante biblioteca.

[4] Filósofo nominalista da idade média, nascido na Inglaterra. De acordo com o historiador soviético de lógica, N. I. Stiazhkin, a classificação das ciências proposta por Ockham no século XIII “comprovou ser muito firme. Basta dizer que por exemplo no atual sistema decimal de classificação de documentos, a seção “sistema científico” (índice 168) se divide nas subseções: “ciências formais” (índice 168.51) e “ciências reais” (índice 168.52), que exatamente corresponde a divisão ockhamista da ciência em racional e real” (STIAZHKIN, 1967, p. 144). Na tradução espanhola da CDU o esquema correspondente ao 168 é “O método científico” e ao 168.51 é “ciências formais” e 168.52 “ciências empíricas”.

[5] Filósofo, matemático, lógico, jurista, político, foi um dos grandes pensadores do século XVII e XVIII. Foi bibliotecário da Casa de Brunswick em Hannover, onde desenvolveu catálogos sistemáticos (ROSS, 1984).

[6] A Enciclopédia foi editada pela primeira vez entre os anos de 1751 e 1772 em Paris, França. Formada por 17 volumes editados por Denis Diderot e Jean Le Rond d’Alembert, seu objetivo geral foi difundir as idéias do Iluminismo francês.

[7] Apareceram limitações nas ciências, incluindo aquelas que pareciam as mais sólidas. Por exemplo na Física, surgiu a teoria da relatividade que destruiu a Física clássica; a física quântica, que parece falhar algumas leis lógicas; e o descobrimento do chamado princípio de indeterminação de Heisenberg. Em matemática o teorema de Gödel acabou com as esperanças de encontrar um sistema formal para a aritmética, onde todas as fórmulas universalmente verdadeiras nela sejam teoremas (teorema de completude), já que estabeleceu que qualquer teoria axiomática não contraditora, em uma linguagem de primeira ordem adequada para a teoria de números é essencialmente incompleta, é dizer, sempre existirá um enunciado aritmético verdadeiro que não se pode demonstrar na teoria.

[8] Em vez de progresso há guerras mundiais, campos de concentração, ditaduras, fome, problemas ecológicos.

[9] Especificamente no catálogo eletrônico, se visualiza a maior quantidade de relações possíveis entre os conteúdos temáticos dos documentos graças aos sistemas de pré-coordenação e pós-coordenação existentes.

[10] O sistema de classificação de Dewey, a classificação decimal universal (CDU), a classificação do Congresso (LC); as Regras de catalogação Anglo-Americanas, segunda edição (AACR2).

[11] Resource Description and Acesss (RDA); Functional Requirements for Bibliographic Records (FRBR).

[12] Entendemos por conceito a forma de pensamento que com base em certas características identifica e distingue certos objetos dentro de um universo, e os agrupa em um conjunto. Este último se denomina volume do conceito.

REFERÊNCIAS

BEUCHOT, M. Posmodernidad, hermenéutica y analogía. México: Miguel Ángel Porrúa: Librero-Editor; Universidad Intercontinental, 1996.

COPLESTON, F. Historia de la filosofía: Grecia y Roma. Barcelona: Ariel, 1986.

GONZÁLEZ CASTRILLO, R. Oposiciones a bibliotecas y archivos. (Escalas de Facultativos y de Ayudantes). Temario Básico. Madrid: Editorial Complutense, 2002.

HABERMAS, J. El discurso filosófico de la modernidad. Madrid: Taurus, 1989.

HABERMAS, J. La modernidad un proyecto incompleto. En: FOSTER, H. et al. La Posmodernidad. México: Kairós-Colofón, 1988. p. 19-36.

HERACLITO. Fragmentos. En: KIRK, G. S.; RAVEN, J. E.; SCHOFIELD, Y. M. S. Los filósofos presocráticos: historia crítica con selección de textos. Madrid: Gredos, 1987.

LEIBNIZ, G. W. New Essays on Human Understanding. En: BENNETT, J. Early modern texts. 1764. Disponível em: <http://www.earlymoderntexts.com/pdfbits/ne43.pdfq>. Acesso em: Setembro de 2009. Disponível em : <http://www.earlymoderntexts.com/leibne.html> Acesso em fevereiro de 2011.

NAUDÉ, G. Advis pour dresser une bibliothèque. Paris: Klincksieck, [1627], 2008.

RENDÓN ROJAS, M. A. Bases teóricas y filosóficas de la bibliotecología. 2 ed. México: UNAM; Centro Universitario de Investigaciones Bibliotecológicas, 2005.

RIAÑO ALONSO, J. J. Naturaleza de la Antigua Biblioteca de Alejandría. España: Trea, 2005.

ROSS, G. M. Leibniz. Oxford: Oxford University Press, 1984.

STIAZHKIN, H. I. Formirovanie matematicheskoi lóguiki (A formação da lógica matemática). Moscou: Nauca, 1967.

ZEA, L. Introducción a la filosofía: la conciencia del hombre en la filosofía. México: UNAM, 1993.

Publicado originalmente no periódico Perspectivas em Ciências da Informação, v. 15, n. 1, p. 3-17, jan./abr. 2010.

Título Original: Bases filosóficas de la organización de la información

Versão em pdf. do artigo no meu SlideShare.

(Tradução originalmente publicada em 19 de fevereiro de 2011.)

O mito da serendipidade

“Ao andar pelas prateleiras da biblioteca (um microcosmo do universo bibliográfico) e dar uma olhada, um usuário pode repentinamente deparar-se com o livro que precisa e dar o crédito de sua sorte à serendipidade. Mas tal achado seria serendipitoso apenas se os livros fossem colocados nas estantes aleatoriamente, considerando que, na verdade, eles estão ordenados de acordo com um sistema rigoroso de relacionamentos semânticos, que como uma mão invisível guia o buscador em seu achado “de sorte”. (SVENONIUS, 2000, p.19)

SVENONIUS, E. The Intellectual Foundations of Information Organization. Cambridge: The MIT Press, 2000. 255 p.

 

Taí um livro que eu gostaria de voltar a ler com calma e atenção. Provavelmente vou utilizá-lo pro artigo final da pós, pois faz todo o sentido.

O que Recuperação Colaborativa da Informação tem a ver com Teoria dos Jogos?

Estes dias estava procurando literatura complementar pra um artigo que estou terminando de escrever e tive a sorte de encontrar este artigo do Karamuftuoglu. Além do nome do autor assustar, o título do artigo também não é exatamente muito convidativo: “Collaborative Information Retrieval: Toward a Social Informatics View of IR Interaction”. Ia ler por que precisava de mais alguma referência, mas é difícil achar artigos bons. E com um título desses a gente só fica pensando que “ok, é só mais um artigo de Ciência da Informação”… Enfim.

Me dei mal, mas me dei bem: este é realmente um bom artigo. Citou brevemente os ‘jogos de linguagem’ pra falar de indexação  (Searle, Austin e Witt) e acabou falando de Teoria de Jogos. Muito bem escrito e criativo, a analogia me fez entender o problema de indeterminação na recuperação da informação – seja ela colaborativa ou não. Também chamou minha atenção o fato de o artigo ter sido escrito em 1998 e continuar tão atual. Mas acredito também que ao analisarmos o problema de categorização com um pouco mais de profundidade, não fica complicado perceber o quanto ele é atemporal. A referência completa do artigo é:

Karamuftuoglu, M. Collaborative Information Retrieval: Towards a Social Informatics View of IR Interaction. JASIS, 49(12), 1070-1080, 1998.

A seguir, alguns parágrafos que achei interessantes neste artigo, embora eu recomende a leitura na íntegra para quem tem interesse em estudos sobre recuperação da informação e colaboratividade.

Obviamente, no início da pesquisa, quais textos serão usados na tecelagem do pano do novo texto não são previsíveis. É uma propriedade emergente, que aparece quando o pesquisador é exposto à novos textos no curso de seu processo de pesquisa, começando por aqueles já conhecidos por ele ou ela. De onde proceder a partir do que já é conhecido, geralmente não é entendido pelo pesquisador em algum ponto durante o processo de pesquisa (cf. Kuhlthau, 1993a). Pesquisadores geralmente procedem sem um critério bem definido e às vezes sem critério algum, interpretando e re-escrevendo os textos recém-descobertos, deste modo inventando e prescrevendo o “critério de relevância” na medida em que avançam.

Este é um “jogo de linguagem” diferente onde quem questiona, inventa (prescreve) o critério de relevância durante o curso do processo, considerando que, na situação da didática (transmissão de informação), o usuário descreve (denota) o que já foi prescrito até certo ponto. Este tipo de invenção é totalmente diferente do tipo discutido na seção anterior. Isso resulta no estabelecimento de conexões entre documentos até então considerados independentes um do outro e modifica o conteúdo intelectual do domínio. Isto é o aspecto intertextual do ato de “inventar” na Recuperação da Informação documentária. (p. 1071-1072)

[…]

É interessante notar que, de acordo com esta visão, não apenas textos como artigos científicos que citam explicitamente outros deveriam ser vistos como parte de uma rede intertextual. A visão intertextual é considerada válida para expressões altamente originais sem um precedente visível, bem como aquelas que se referem explicitamente a outras. Isso é claramente colocado por Kristeva (1986, p. 37, grifo nosso): “Qualquer texto é construído como um mosaico de citações; qualquer texto é a absorção e transformação de outro”. Como este segundo tipo de invenção na Recuperação de Informação normalmente acontece por um longo período de tempo, e a relevância de documentos ao trabalho inventivo não é determinado à priori mas uma propriedade emergente, o significado de um documento não pode ser observado de imediato no momento da interação.

Isso é particularmente verdade para certos estágios da atividade de pesquisa, onde a tarefa é formular o problema e/ou as soluções possíveis para ele. É, no entando, totalmente plausível assumir que a relevância de um documento através do ciclo de vida de uma atividade de pesquisa pode mudar, de modo que, um documento inicialmente não relevante pode tornar-se relevante com o tempo e vice versa (cf. van Rijsbergen, 1996). Esta não é uma característica amplamente reconhecida na interação de Recuperação da Informação (van Rijsbergen, 1996).

É geralmente aceito, claro, que existe uma “indeterminação” inerente na recuperação de documentos, por isso é adotada a abordagem probabilística. Entretanto, a natureza probabilística da Recuperação da Informação é geralmente pensada como o resultado de uma informação inadequada (ou falta de informação) sobre o problema, o estado cognitivo do usuário e a representação dos documentos (cf. Robertson, 1978). Se fosse possível que existisse informação completa (perfeita), assume-se que a natureza probabilística desapareceria. O caso aqui é análogo à jogos de informação imperfeita na “Teoria dos Jogos” (tais como os classificados jogos de coordenação Rasmusen, 1989, p. 45), onde a indeterminação (incerteza) é causada pela falta de informação completa sobre os movimentos do(s) oponente(s) no jogo (Rapoport, 1960; Rasmusen, 1989). (p. 1072)

Visualisando a organização e disseminação de conhecimento: esboços de Paul Otlet no Mundaneum

Organisation_mondialeedit_oJá no final do século XIX e no início do século XX vários acadêmicos europeus, como Patrick Geddes (1854-1932), Wilhelm Ostwald (1853-1932), Paul Otlet (1868-1944) e Otto Neurath (1882-1944) exploravam novas formas de organizar, visualizar e disseminar conhecimento em nível global, encontrando problemas similares mas também aparecendo com soluções comparáveis à Internet e à Rede Mundial de Computadores (World Wide Web).

O belga Paul Otlet (1868-1944) junto com o político e vencedor do prêmio Nobel da Paz de 1913, Henry La Fontaine, no período anterior à Primeira Guerra Mundial formaram várias organizações do “conhecimento” em Bruxelas: o Instituto Internacional de Bibliografia (1895), uma Biblioteca Internacional montados a partir de coleções de sociedades científicas e outras associações em Bruxelas (1906), um Museu Internacional (1910), a União de Associações Internacional (1910), e uma Universidade Mundial (1920), etc. tudo combinado depois da Guerra no que Otlet chamava de Palais Mondial (Palácio Mundial), posteriormente o Mundaneum, uma estrutura física imensa que era parte do Palais du Cinquantenaire em Bruxelas. Uma forma de Mundaneum no início dos anos 90 foi recriado em Mons, Bélgica, como um museu e arquivo dedicado em grande parte ao trabalho de Otlet e La Fontaine.

Formas Visuais de Conhecimento

Primeiramente, Otlet estava interessado nos modos em quais as imagens poderiam ser usadas para simplificar e mostrar informações complexas. “Documentação”, um termo que cunhou em 1904, para ele envolvia a mobilização não apenas de documentos escritos mas de documentos de todos os tipos e ele valorizava as imagens, esquemas, gráficos, tabelas e etc. Em sua visão o livro era um portador inconveniente e ineficiente de informação que teria que ser decomposto e dissecado a fim de serem retiradas suas “partes” (bits) mais essenciais e valorosas de informação. Gravado separadamente de acordo com o que Otlet chamava de “princípio monográfico”, cada item individual de informação poderia então ser reprocessado de vários modos para uma disseminação e uso mais efetivo.

Heuvelrayward01_1(Fig. 1) O livro dissecado e recomposto em arquivos para formar a base de uma nova forma de fonte enciclopédica; Fonte: Mons, Archives du Musée du Mondaneum, EUM [1934].

Posteriormente em sua vida, a preocupação de Otlet com a visualização intensificou-se. Ele começou a desenvolver o que ele chamava de Atlas Mundaneum (Encyclopaedia Universalis Mundaneum), no qual ele buscou expressar as idéias em organização do conhecimento, visualização e disseminação que ele tratou in extenso por escrito em seu Traité de documentation (1934). O Atlas Mundaneum também pretendia visualizar suas visões na emergência de uma sociedade global que ele sumarizou no texto por vezes enigmático do Monde (1935). Para as várias seções do Atlas Mundaneum, e como ele experimentou com idéias visuais geralmente, imagens variando de rabiscos em pequenos pedaços de papel, para papéis maiores mais totalmente desenvolvidos, às vezes multicoloridos, para grandes imagens finais formais em “tableaux”  padronizado ou gráficos a ser achado aos milhares no Mundaneum em Mons. Na última dessas imagens Otlet começou a experimentar com visualizações 3D e 4D “móveis” de informação e apareceu com soluções que chegam próximas à apresentações de mudanças de relações entre dados em interfaces designadas para o computador.

Heuvelrayward02_2(Fig 2) Otlet, Visualização do Le Plan Mondial na forma de um cubo movendo-se junto de 3 eixos. Fonte: Mons, Archives du Musée du Mundaneum, EUM, OP 103 : « Le plan mondial » [1934-35].

Nesta visualização do Le Plan Mondial, os três lados visíveis de um cubo representam 1) os domínios, 2) os setores e 3) os instrumentos do plano do mundo. O movimento do cubo junto com os três eixos etiquetados: 4 (grau de alcance), 5 (espaço), e 6 (tempo), mudariam os relacionamentos entre os dados.

Alguns exemplos da visualização de organização e disseminação de conhecimento de Otlet

Deveria ser notado que Otlet não era nenhum artista e que sua visão era especialmente ruim referente ao fim da sua vida. Como ele experimentou com diferentes tipos de imagens, o resultado, especialmente cedo no processo de trabalho e retrabalho suas idéias grandiosas de globalização e universalismo, são imagens que são muito mal desenhadas. Uma imagem fascinante e complexa do “le reseau mondial”, a rede mundial de documentação ou de rede do que hoje chamaríamos de informações, é apresentado a seguir. Ela descreve os processos e as relações das instituições de organização de conhecimento a que Otlet tinha dedicado sua vida. Essa rede linka o cidadão em uma estrutura hierarquica a uma cidade mundial “emblemática”  como um objeto arquitetônico e para uma grande central de organização do conhecimento, o Mundaneu, como uma instituição física. Isso mostra o quao longe ele foi na tentativa de capturar as características essenciais da rede a partir do diagrama relacionado, publicado em seu Traité de Documentation:

Heuvelrayward03_1(Fig. 3) A “internet” de Otlet linkando o indivíduo ao “civitas mundaneum”. Fonte: Mons, Archives du Musée du Mundaneum, EUM.

Otlet prevê uma rede à qual o acesso é por meio de uma tela e um telefone, tudo o que o estudioso teria necessidade em última instância, ele acreditava, em sua mesa de trabalho. Em seu Encyclopedia Universalis Mundaneum Otlet visualiza uma forma de teleconferência envolvendo o gramofone, filme, rádio e televisão, antecipando o que nós chamamos atualmente de hipermídia. A versão do Otlet de Internet ou Rede Mundial de Computadores (World Wide Web), tem apenas recentemente alcançado as dimensões multimídia e interativas que ele previu. Ele imagina um arranjo de máquinas multimídia ilustrados na próxima imagem tendo uma capacidade interativa importante que em efeito criariam uma realidade “virtual”.

“Cinema, fonógrafo, rádio, televisão – estes instrumentos considerados substitutos para o livro se tornaram na verdade o novo livro, o mais poderoso dos meios para a difusão do pensamento humano. Pelo rádio não apenas podemos ouvir de todos os lugares mas também falar de todos os lugares. Por meio da televisão não só um ser capaz de ver o que está acontecendo em toda parte, mas todo mundo será capaz de ver o que ele gostaria de ver o seu próprio ponto de vista. Desta poltrona, todo mundo irá ouvir, ver, participar, será até mesmo capaz de aplaudir, ovacionar, cantar junto, adicionar seus gritos de participação para todos os outros” (Otlet, Traité de Documentation 1934, 431).

Heuvelrayward04(Fig. 4) A “hipermídia” de Otlet: teleconferência combinando telefone, rádio, gramofone, filmes e televisão. Fonte: Mons, Archives du Musée du Mundaneum, EUM.

Um esboço de caneta tinteira de 1943, o ano anterior à morte de Otlet, une suas idéias sobre um mundo em rede global. Nós vemos o Mundaneum mais uma vez no formato espiral originalmente proposto em 1928 pelo famoso arquiteto, Le Corbusier, para um prédio para o Mundaneum nas margens do lago Geneva. No entanto Otlet agora mostra o Mundaneum não apenas como uma estrutura física, um museu, que contém representações da acumulação do conhecimento através do tempo. Também é apresentado como transmissor global de conhecimento através do som (“rádio-telefone”) e por imagem (“rádio-televisão”).

Heuvelrayward05_1(Fig. 5) Esboço feito com caneta tinteira de Otlet para o Mundaneum, “uma máquina para contemplar o mundo a partir de uma poltrona em telas individuais”. Fonte: Mons, Archives du Musée du Mundaneum, 1943.08.15.

Esse áspero e experimental rascunho é efetivamente uma visualização do que Otlet escreveu em Monde (1935): a necessidade de

” (…) uma instrumentação agindo através da distância que combinaria ao mesmo tempo rádio, raio-x, cinema e micro-fotografia. Todas as coisas do universo e todas aquelas do homem seriam registradas a longa distância enquanto fossem produzidas. Entretanto a imagem em movimento do mundo seria estabelecida – sua memória, sua verdadeira duplicata. A longa distância qualquer um seria capaz de ler a passagem que, expandida ou limitada ao assunto desejado, seria projetado em sua tela individual. Assim, em sua poltrona qualquer um seria capaz de contemplar toda a criação ou partes particulares dela”.

Uma imagem surpreendente quando se contempla declaração Tim Berners-Lee: “Minha visão original para uma rede universal era uma poltrona para ajudar as pessoas a fazerem coisas na vida real da web” (Weaving the Web, 1999, p. 177-178).

Referências

European Modernism and the Information Society Conference site
http://www.lis.uiuc.edu/conferences/EuroMod.05/

W. Boyd Rayward, Visions of Xanadu: Paul Otlet (1868-1944) and Hypertext JASIS 45 (1994):235-250
http://alexia.lis.uiuc.edu/~wrayward/otlet/xanadu.htm

Charles van den Heuvel – University of Maastricht, Faculty of Arts and Culture, Technology and Society Studies- Leiden, University Library, Map curator Collection Bodel Nijenhuis
c.vandenheuvel@tss.unimaas.nl

W. Boyd Rayward – Graduate School of Library and Information Science – University of Illinois at Urbana-Champaign
http://alexia.lis.uiuc.edu/~wrayward/rayward.html

Publicado originalmente no blog Envisioning a Path to the Future, em 11 de julho de 2005.

Título original: Visualizing the Organization and Dissemination of Knowledge: Paul Otlet’s Sketches in the Mundaneum, Mons – Charles van den Heuvel and W. Boyd Rayward

Ontologias são Superestimadas: Categorias, Links e Etiquetas

Esse texto é baseado em duas palestras que dei na primavera de 2005 — uma na conferência O’Reilly ETech em março, intitulada “Ontologias são superestimadas” e outra no IMCExpo em abril entitulada “Folksonomias & Etiquetas: a emergência da classificação desenvolvida por usuários”. A versão escrita é uma grande edição destas duas palestras.

Hoje eu quero falar sobre categorização e quero convencê-los de que muito do que pensamos saber sobre categorização está errado. Em particular, quero convencê-los de que várias das tentativas de aplicar a categorização ao mundo eletrônico são na verdade inadequadas, porque adotamos hábitos mentais que são frutos de estratégias antigas.

Também quero convencê-los de que o que vemos na Web é na verdade uma ruptura radical com as estratégias prévias de categorização, em vez de uma extensão delas. A segunda parte da palestra é mais especulativa, por que geralmente acontece de os velhos sistemas se quebrarem antes mesmo que as pessoas saibam o que tomará o seu lugar. (Qualquer pessoa que observa a indústria musical pode ver isso acontecendo hoje). Isso é o que eu acho que está acontecendo com a categorização.

O que acho que está por vir são modos muito mais orgânicos de organização da informação – do que os nossos atuais esquemas de categorização permitem – baseado em duas unidades: o link, que pode apontar para qualquer coisa, e a tag (etiqueta), que é uma forma de anexar marcações em links. A estratégia de etiquetagem (tagging) — uma forma livre de marcação, sem levar em conta restrições de categorias — parece ser uma receita para o desastre, mas como a Web tem nos mostrado, você pode extrair uma quantidade surpreendente de valor de conjuntos de informações completamente bagunçados.

PARTE I: Classificação e seus (Des)Conteúdos

Q: O que é Ontologia? A: Depende de qual o significado de “é” é.

Preciso fornecer algumas definições rápidas, começando com ontologia. É uma rica ironia que a palavra “ontologia”, que tem a ver com esclarecer e explicitar afirmações sobre entidades num domínio particular, tenha tantas definições conflitantes. Oferecerei duas definições gerais.

A principal definição de ontologia no sentido filosófico é o estudo das entidades e suas relações. A questão que a ontologia pergunta é: quais tipos de coisas existem ou podem existir no mundo, e que tipo de relações essas coisas podem ter umas com as outras? Ontologia está menos preocupada com o que é do que com o que é possível.

As comunidades de gestão do conhecimento e inteligência artificial tem uma definição relacionada — eles pegaram a palavra “ontologia” e aplicaram-na mais diretamente ao seu problema. O sentido de ontologia é algo como “uma especificação explicita de uma conceitualização”.

O ponto comum entre as duas definições é a essência, o qualidade/capacidade de ser. Em um domínio particular, quais tipos de coisas nós podemos dizer que existem naquele domínio e como nós podemos dizer que essas coisas relacionam-se entre si?

O outro par de termos que preciso definir é categorização e classificação. Esses são os atos de organizar uma coleção de entidades, sejam coisas ou conceitos, em grupos relacionados. Embora existam algumas distinções de campo para campo, os termos são usados em geral de forma intercambiável.

E então há a categorização ou classificação ontológica, que é organizar um conjunto de entidades em grupos, baseados em suas essências e possíveis relações. Um catálogo de biblioteca, por exemplo, entende que para cada livro novo, seu lugar lógico já existe dentro do sistema, mesmo antes de o livro ser publicado. Essa estratégia de designação de categorias para cobrir possíveis casos antecipadamente é o que me preocupa, pois é tanto amplamente usado quanto totalmente ultrapassado em termos de valor no mundo digital.

Agora, qualquer pessoa que lide com categorização em sua profissão irá dizer que nunca se pode conseguir um sistema perfeito. Em sistemas de classificação que funcionam, o sucesso não é “Conseguimos o arranjo ideal?” mas “O quão perto chegamos e em que medidas?”. A idéia de um esquema perfeito é simplesmente um ideal platônico. Entretanto, quero argumentar que mesmo o ideal ontologico é um erro. Até mesmo usar perfeição teórica como medida de sucesso prático leva a má aplicação de recursos.

Agora, aos problemas da classificação.

Dividindo a natureza em suas articulações

[ A Tabela Periódica de Elementos ]

A tabela periódica de elementos é o meu voto para “Melhor Classificação de Todos os Tempos”. Parece que ao organizar elementos pelo número de prótons no núcleo, você tem todo esse valor fantástico, tanto descritivo quanto previsível. E já que o que você está fazendo é organizar coisas, a tabela periódica está tão próxima de fazer afirmações sobre essência tanto quanto for fisicamente possível. Esse é um esquema realmente poderoso, quase perfeito. Quase.

Ali na coluna do lado direito, a coluna rosa, estão os gases nobres. Bem, gás nobre é uma categoria estranha, porque hélio não é mais gás do que mercúrio é um líquido. Hélio não é fundamentalmente um gás, é só um gás nas temperaturas mais altas, mas as pessoas que o estudavam na época não sabiam isso, porque elas não eram capazes de fazê-lo frio o suficiente para ver que hélio, como qualquer outra coisa, tem estados diferentes da matéria. Sem as medidas corretas, eles assumiram que a gasosidade era um aspecto essencial – literalmente, parte da essência – destes elementos.

Mesmo num esquema de categorização quase perfeito, existem esses tipos de erro de contexto, onde as pessoas estão colocando algo que é meramente verdade em temperatura ambiente, e é absolutamente não relacionado à essência, bem no centro da categorização. E a categoria ‘gás nobre’ permaneceu lá desde o dia em que a colocaram, por que nós todos nos acostumamos a essa anomalia como se fosse um acidente congelado.

Se é impossível criar uma categorização completamente coerente, mesmo quando você está fazendo algo fisicamente relacionado a essência como química, imagine os problemas encarados por qualquer um que esteja lidando com um domínio onde a essência é ainda menos óbvia.

O que me leva ao assunto das bibliotecas.

Sobre fichas e catálogos

A tabela periódica leva meu voto para melhor esquema de categorização de todos os tempos, mas as bibliotecas tem os melhores esquemas de categorização conhecidos. A experiência do catálogo de biblioteca é provavelmente o que as pessoas conhecem melhor como uma visão altamente ordenada do mundo, e esses sistemas de catalogação contém todos os tipos de mapeamentos estranhos entre as categorias e o mundo que eles descrevem.

Aqui está a categoria de primeiro nível nos sistemas de biblioteca soviéticos:

A: Marxismo-Leninismo
A1: Trabalhos clássicos de Marxismo-Leninismo
A3: Vida e trabalho de K.Marx, F.Engels, V.I.Lenin
A5: Filosofia Marxista-Leninista
A6: Economia Política Marxista-Leninista
A7/8: Comunismo Científico

Algumas dessas categorias estão começando a parecer um pouco datadas.

Ou, a minha favorita — essa é a categorização do sistema decimal de Dewey para religiões do mundo, que está na categoria 200.

Dewey, 200: Religião
210 Teologia Natural
220 Bíblia
230 Teologia cristã
240 Moral cristã & teologia de devoção
250 Ordens cristãs e igrejas locais
260 Teologia social cristã
270 História da igreja cristã
280 Divisões cristãs e denominações
290 Outras religiões

O quanto essa não é o tipo de categorização que queremos no século 21?

Esse tipo de parcialidade existe muito em sistemas de categorização. Aqui está a categorização de história da Biblioteca do Congresso. Essas são todas as categorias de primeiro nível — todas essas são apresentadas como sendo de mesmo nível.

D: História (geral)
DA: Grã Bretanha
DB: Áustria
DC: França
DD: Alemanha
DE: Mediterrâneo
DF: Grécia
DG: Itália
DH: Países Baixos
DJ: Holanda DK: Antiga União Soviética
DL: Escandinávia
DP: Peninsula Ibérica
DQ: Suíça
DR: Península Balcânica
DS: Ásia
DT: África
DU: Oceania
DX: Ciganos

Eu gostaria de chamar atenção para os que estão em negrito: a Península Balcânica. Ásia. Africa.
E só, enfim, reveja a geografia:

[ Viu a diferença? ]

Porém, por toda a esquisitice de colocar a Peninsula Balcã e a Ásia no mesmo nível, isso é ainda mais difícil de rir do que o exemplo de Dewey, por ser tão intrigante. A Biblioteca do Congresso — não há folgados no departamento de inteligência, fundado por Thomas Jefferson — tem um staff de pessoas que não fazem nada a não ser pensar em categorização o dia inteiro. Então o que está sendo otimizado aqui? Não é geografia. Não é a população. Não é o PIB regional.

O que está sendo otimizado é o número de livros na estante. É isso o que o esquema de categorização está categorizando. É tentador pensar que os sistemas de classificação que as bibliotecas otimizaram no passado podem ser estendidos de forma descomplicada para o mundo mundo digital. Isto subestima horrivelmente, no meu ponto de vista, o quanto aquilo que as bibliotecas têm organizado historicamente se configura em um problema completamente distinto.

A musculatura do esquema de categorização da Biblioteca do congresso parece se basear em conceitos. É organizado em categorias que não se sobrepõem, ficando mais detalhadas em níveis menores — qualquer conceito deve encaixar-se em uma categoria e em nenhuma outra categoria. Mas vez e outra, o esqueleto transparece, e esse esqueleto, a estrutura de apoio na qual o sistema é realmente construído, é designado para minimizar o tempo de busca nas estantes.

A essência de um livro não são as idéias que ele contém. A essência de um livro é “livro”. Pensar que catálogos de biblioteca existem para organizar conceitos confunde o recipiente por aquilo que ele contém.

O esquema de categorização é uma resposta às restrições físicas de armazenamento e à incapacidade das pessoas de manterem a localização de mais de uma centena de coisas em suas mentes de uma vez. Uma vez que você tem mais de uma centena de livros, você tem que organizá-los de alguma forma. (Minha mãe, que era uma bibliotecária de referência, disse que ela queria reorganizar toda a biblioteca universitária por cor, porque os estudantes chegavam nela e diziam “Estou procurando por um livro verde de sociologia…”). De qualquer maneira que você faça isso, a fragilidade da memória humana e o fato físico de livros tornarem algum tipo de esquema organizacional um requisito, e a hierarquia, é um bom modo de administrar objetos físicos.

O tipo de desequilibrio “Península Balcânica/Ásia” é simplesmente um subproduto de restrições físicas. Não são as idéias em um livro que tem que estar em um lugar — o livro pode ser de várias coisas ao mesmo tempo. É o livro em si, o fato físico do objeto relacionado, que tem que estar em um lugar, e se está em um lugar, não pode estar em outro. E isso significa que um livro tem que declaradamente ser sobre uma coisa principal. Um livro que é igualmente sobre duas coisas quebra o requerimento de ‘estar em um lugar’, então cada livro precisa ser declarado ser sobre uma coisa mais que outras, independente de seu conteúdo de fato.

As pessoas tem se assustado com a virtualidade das informações por décadas e você pensa que nós internalizamos a verdade óbvia: não existem prateleiras. No mundo digital, não existem restrições físicas que nos obrigam a esses tipos de organização. Nós podemos fazer sem ele, e você acha que já deveríamos ter aprendido uma lição até então.

E ainda…

A parábola do ontólogo, ou, “Não existem estantes”

Um pouco mais de 10 anos atrás, alguns caras da Stanford lançaram um serviço chamado Yahoo que oferecia uma lista de coisas disponíveis na Web. Foi a primeira tentativa realmente significativa de tentar trazer ordem à Web. Como a Web expandiu-se, a lista do Yahoo se desenvolveu numa hierarquia de categorias.Como a Web expandiu-se mais ainda eles perceberam que, para manter o valor no diretório, eles teriam que sistematizar, então eles contrataram um ontólogo profissional e desenvolveram suas próprias categorias de alto nível, agora familiares, que tem subcategorias e cada subcategoria contém links para ainda outras subcategorias, e assim por diante. Agora temos essa lista ontologicamente administrada sobre o que existe por aí.

Aqui estamos em uma das categorias de alto nível do Yahoo, Entretenimento.

[ Categoria de Entretenimento do Yahoo ]

Você pode ver o que as sub-categorias de entretenimento são, tenham ou não novas adições, e quantos links ficam embaixo dessas subcategorias. Exceto, no caso de Livros e Literatura, aquela sub-categoria não te diz quantos links tem abaixo dela. Livros e Literatura não terminam com um número de links, mas com um sinal de “@”. Esse sinal está te dizendo que a categoria de Livros e Literatura não é ‘na realidade’ na categoria de entretenimento. O Yahoo está dizendo “Nós colocamos esse link aqui para sua conveniência, mas isso é apenas pra te levar onde Livros e Literatura ‘realmente’ estão”. Ao que podemos apenas responder — “O que é real?”

O Yahoo está dizendo “Nós entendemos melhor que você como o mundo é organizado, por que nós somos profissionais treinados. Então se você pensar erroneamente que Livros e Literatura são entretenimento, nós colocaremos um sinalzinho para que você entenda mas para ver esses links, você terá que ‘ir’ onde eles ‘estão’”. (Meus dedos irão cair por causa de todas essas apóstrofes). Quando você vai para Literatura — que é parte de Humanidades e não Entretenimento — dizem pra você, similarmente, que os vendedores de livros não estão ‘realmente’ ali. Por serem um serviço comercial, vendedores de livros estão ‘na verdade’ em Negócios.

[ ‘Literatura’ no Yahoo ]

Veja o que aconteceu aqui. O Yahoo, encarando a possibilidade de que eles poderiam organizar coisas sem restrições físicas, adicionaram de volta a estante. Eles não poderiam imaginar a organização sem as limitações das estantes, então eles as adicionaram de volta. É perfeitamente possível para qualquer número de links estar em qualquer número de lugares numa hierarquia, ou em várias hierarquias, ou em nenhuma hierarquia sequer. Mas o Yahoo decidiu privilegiar um modo de organizar os links sobre todos os outros, por que eles queriam fazer afirmações sobre o que é “real”.

Uma explicação caridosa para isso é que eles pensaram nesse tipo de organização a priori como seu trabalho e como algo que seus usuários valorizariam. A explicação não caridosa é que eles pensaram que existia valor de negócios em determinar a visão que o usuário teria de adotar para usar o sistema. Ambas explicações podem ter sido verdade em tempos diferentes e em medidas diferentes, mas o efeito foi sobrepor a conclusão dos usuários sobre onde as coisas deveriam estar e insistir na visão do Yahoo.

Sistemas de Arquivos e Hierarquia

É fácil ver como a hierarquia do Yahoo mapeia as restrições tecnológicas bem como as físicas. As restrições no diretório do Yahoo descrevem tanto um esquema de categorização da biblioteca e, obviamente, um sistema de arquivo – o sistema de arquivo é tanto uma ferramenta poderosa quanto uma metáfora poderosa, e estamos tão acostumados a ela que parece natural.

[ Hierarquia ]

Há um nível no topo e os subdiretórios ficam abaixo dele. Subdiretórios contém arquivos ou outros subdiretórios e assim por diante, até embaixo. Tanto bibliotecários e cientistas da computação chegam à mesma idéia similar, que é “Bem, não faz mal adicionar alguns poucos links secundários aqui” — links, aliases e atalhos simbólicos, como quiser chamá-los.

[ Mais Links ]

A biblioteca do congresso tem algo similar em sua categorização de segunda ordem — “Esse livro é principalmente sobre a Península Balcânica, mas também é sobre arte, ou é principalmente sobre arte, mas também sobre a Península Balcânica”. A maioria das tentativas hierárquicas de subdividir o mundo utilizam algum sistema assim. Então, no início dos anos 90, uma das coisas que o Berners-Lee nos mostrou é que você poderia ter vários links. Você não precisa ter só alguns poucos links, você poderia ter vários deles.

[ Mais Vários Links ]

Foi aqui que o Yahoo entrou na contramão. Eles disseram “Saiam daqui com essa conversa maluca. Uma URL pode apenas aparecer em três lugares. Essa é a regra do Yahoo”. Eles fizeram isso em parte por que eles não queriam receber spam, uma vez que eles estavam fazendo um diretório comercial, então eles colocaram um limite no número de links simbólicos que pudessem interferir em sua visão de mundo. Eles perderam o final dessa progressão, que é, se você tem links o suficiente, você não precisa mais de hierarquia. Não existem estantes. Não existem sistemas de arquivos. Links por si sós são suficientes.

[ Apenas Links (Não há Sistemas de Arquivos) ]

Um motivo pelo qual o Google foi adotado tão rapidamente quando ele apareceu foi porque ele compreendeu que não existem estantes e que não existem sistemas de arquivos. O Google pode decidir o que vai com o que depois de ouvir o usuário, ao invés de tentar prever antecipadamente o que você precisa saber.

Vamos dizer que eu preciso de todas as páginas da web com as palavras “incontrolável” e “Minnesota”. Você não pode perguntar antes a um catalogador para dizer “Bem, essa será uma categoria útil, então deveríamos codificar isso antecipadamente”. Ao invés disso, o que o catalogador dirá é “Incontrolável mais Minnesota! Esqueça, nós não vamos otimizar coisas assim”. Google, por outro lado diz, “Quem se importa? Não iremos dizer ao usuário o que fazer, por que a estrutura de links é mais complexa do que podemos ler, exceto em resposta a uma busca de um usuário”.

Navegação versus busca é um aumento radical na confiança que colocamos na infraestrutura de link, e no grau de poder derivado dessa estrutura de links. Navegar ou “dar uma olhada” diz às pessoas que estão fazendo a ontologia, às pessoas fazendo a categorização, que elas tem a responsabilidade de organizar o mundo antecipadamente. Dado esse requisito, os pontos de vista dos catalogadores necessariamente sobrepõem-se às necessidades dos usuários e às suas visões de mundo. Se você quer algo que ainda não tenha sido categorizado na forma que você pensou, azar o seu.

O paradigma da busca diz o inverso. Diz que ninguém pode dizer a você antecipadamente o que você precisa. A busca diz que, no momento em que você procura, nós faremos nosso melhor para servi-lo baseado nessa estrutura de link, por que nós acreditamos que podemos construir um mundo onde não precisamos de hierarquia para coexistir com a estrutura de link.

Muito das conversas que estão acontecendo agora sobre categorização têm início em uma segunda etapa — “Uma vez que a categorização é uma boa forma de organizar o mundo, nós deveríamos…” Mas o primeiro passo é se fazer a pergunta crítica: a categorização é mesmo uma boa idéia? Nós podemos ver, através do exemplo Yahoo versus Google que existe um número de casos onde você pode extrair valor significante da não categorização. Até o Google adotou o DMOZ, a versão aberta do diretório do Yahoo e depois eles diminuíram sua presença no site porque quase ninguém o usava. Quando as pessoas tiveram o serviço de busca e categorização lado a lado, menos e menos gente estava usando categorização para achar as coisas.

Quando a classificação ontológica funciona bem?

A classificação ontológica funciona bem em alguns lugares, claro. Você precisa de um catálogo de fichas se você estiver trabalhando numa biblioteca física. Você precisa de uma hierarquia para a gestão de um sistema de arquivos. Então o que você quer saber, quando pensa em como organizar qualquer coisa, é se esse tipo de classificação é uma boa estratégia.

Aqui está uma lista parcial de características que ajuda a fazer isso:

Domínio a ser organizado

* Pequeno corpus
* Categorias formais
* Entidades estáveis
* Entidades restritas
* Limites claros

Essas são todas as coisas de domínio-específico que você gostaria que fossem verdades, se você está tentando fazer uma classificação transparente. A tabela periódica de elementos tem todas essas coisas – existem apenas cem elementos ou quase isso; as categorias são simples e deriváveis; prótons não mudam por causa de circunstâncias políticas; apenas elementos podem ser classificados, não moléculas; existem elementos mesclados; e assim por diante. Quanto mais dessas características forem verdade, melhor adequada a ontologia será.

Outra questão chave, além das características do próprio domínio, é “Como são os participantes?”. Aqui estão algumas coisas que, se verdadeiras, ajudam a fazer com que a ontologia seja uma estratégia de classificação que funcione:

Participantes

* Catalogadores experientes
* Fonte autoritativa de julgamento
* Usuários coordenados
* Usuários experientes

DSM-IV, a quarta versão do Manual Diagnóstico e Estatístico de Psiquiatria, é um exemplo clássico de um esquema de classificação que funciona por causa dessas características. DSM IV permite que os psiquiatras de todo os EUA, em teoria, façam o mesmo julgamento sobre uma doença mental, quando apresentada com a mesma lista de sintomas. Existe uma fonte de autoridade para o DSM-IV, a Associação Americana de Psiquiatras. A APA diz quais sintomas levam à psicose. Eles tem tanto catalogadores especialistas quanto usuários especialistas. A quantidade de ‘infraestrutura pessoal’ que está por trás de um sistema de trabalho como o DSM IV é uma grande parte o que faz esse tipo de categorização funcionar.

Essa ‘infraestrutura pessoal’ é muito cara, no entanto. Um dos problemas que os usuários tem com as categorias é que quando estamos fazendo exames cara a cara – descrevemos algo e então questionamos usuários para que adivinhem como descrevemos – os resultados são bastante discrepantes. Usuários tem muitas dificuldades tentando adivinhar como algo que eles querem foi categorizado, a menos que eles tenham sido educados sobre essas categorias também, e quanto maior a base do usuário, mais funcional é a educação desse usuário.

Você também pode inverter essa lista. Você pode dizer “aqui estão algumas características onde a classificação ontológica não funciona bem”:

Domínio
* Amplo corpus
* Sem categorias formais
* Entidades instáveis
* Entidades irrestritas
* Sem limites claros

Participantes
* Usuários sem coordenação
* Usuários amadores
* Catalogadores ingênuos
* Sem autoridade

Se você em um corpus amplo e mal definido, se você tem usuários amadores, se seus catalogadores não são especialistas, se não há ninguém com autoridade para dizer o que está acontecendo, então a ontologia será uma má estratégia.

A lista de fatores que faz com que a ontologia seja uma aplicação ruim é, também, uma descrição quase perfeita da Web – maiores corpus, usuários mais ingênuos, nenhuma autoridade global e assim por diante. Quanto mais você empurra a direção de escala, amplitude, fluidez, flexibilidade, o mais difícil se torna para lidar com o custo de iniciar um sistema de catalogação e o esforço de mantê-lo, para não falar da quantidade de domínio que você deve ter sobre os usuários para que eles desistam de suas próprias visões de mundo em favor da sua.

O motivo de sabermos que as SUVs são um tipo de camionete leve ao invés de um carro, é que o Governo diz que eles são um camionete leve. Isso é categorização vodu, onde a ação no modelo muda o mundo – quando o Governo diz que uma SUV é uma camionete, ela é uma camionete por definição. Muito do apelo de categorização surge deste tipo de vodu, onde as pessoas que fazem a categorização acreditam, mesmo que inconscientemente, que nomear o mundo pode mudá-lo. Infelizmente, a maioria do mundo não está isento da categorização vodu.

A razão pela qual não sabemos se Buffy, A caça vampiros, é ficção científica ou não, por exemplo, é por que ninguém pode dizer definitivamente sim ou não. Em ambientes em que não há autoridade e nenhuma força pode ser aplicada ao usuário, é muito difícil apoiar o estilo vodu de organização. Meramente nomear o mundo não cria nenhuma mudança efetiva, nem no mundo, nem na mente dos potenciais usuários que não entendem o sistema.

Leitura de mentes

Um dos maiores problemas em categorizar as coisas antecipadamente é que isso força os categorizadores a lidarem com dois trabalhos que tem sido historicamente bem difíceis: leitura de mentes e previsão do futuro. Isso força os categorizadores a adivinharem o que seus usuários estão pensando, e fazerem previsões sobre o futuro. O aspecto de leitura de mente aparece em conversas sobre vocabulários controlados. Sempre que é concedida permissão aos usuários para etiquetar coisas, alguém sempre diz “Ei, eu sei! Vamos fazer um tesauro, porque se você etiquetar algo como ‘Mac’ e eu etiquetar ‘Apple’ e alguém mais etiquetar como ‘OSX’, nós todos acabamos procurando pela mesma coisa!” Eles apontam para a perda de sinal sobre o fato que usuários, embora usando diferentes etiquetas, estejam falando sobre a mesma coisa.

O entendimento é que nós tanto podemos e deveríamos ler as mentes das pessoas, que nós podemos entender o que elas querem dizer quando elas usam uma etiqueta em particular, e, entendendo isso, nós podemos começar a restringir essas etiquetas, ou ao menos mapeá-las facilmente uma nas outras.

Isso parece relativamente simples com o exemplo Apple/Mac/OSX, mas quando começamos a expandir a outros grupos de trabalhos relacionados, como filmes, filmagens e cinema, o caso para tesauro se torna muito mais claro. Aprendi isso com o design de Brad Fitzpatrick para o LiveJournal, que permite que o usuário liste seus próprios interesses. LiveJournal não faz absolutamente nenhuma tentativa de reforçar solidariedade ou um tesauro ou um conjunto mínimo de termos, nenhum check-box, nenhum drop-box, apenas texto livre. Algumas pessoas dizem que têm interesse em filmes. Algumas dizem que estão interessadas em filmagens. Algumas pessoas dizem que estão interessadas em cinema.

A primeira reação dos catalogadores a isso é “Meu deus, isso significa que você não estará apresentando as pessoas dos filmes para as pessoas do cinema!” para qual a resposta óbvia é “Bom. As pessoas dos filmes não querem se relacionar com as pessoas do cinema”. Esses termos na verdade codificam coisas diferentes, e a afirmação que restrição de vocabulário melhora o sinal assume que não há sinal na diferença em si, e nenhum valor em proteger o usuário de vários sinônimos.

Quando falamos sobre termos realmente controversos como bicha/gay/homossexual, nesse ponto, toda a perda de sinal está no colapso, não na expansão. “Oh, as pessoas falando sobre ‘políticas públicas GLBT’ e as pessoas falando sobre a ‘agenda homossexual’, eles estão falando na verdade sobre a mesma coisa”. Oh não, não estão. Se você achava que as pessoas dos filmes e do cinema poderiam ter uma briga, espere até você colocar as pessoas dos políticas GLBT e agenda homossexual no mesmo lugar…

Você não pode fazer isso. Você não pode colapsar categorizas sem alguma perda de sinal. O problema é que, uma vez que os catalogadores assumem que sua classificação deveria ter força no mundo, eles subestimam a dificuldade de compreender o que os usuários estão pensando, e eles superestimam a quantidade de usuários que irão concordar, sejam entre si mesmos ou com os catalogadores, sobre a melhor forma de categorização. Eles também subestimam a perda de apagar a diferença de expressão, e eles superestimam a perda da falta de um tesauro.

Previsão do Futuro

O outro grande problema é que prever o futuro pode vir a ser difícil, e ainda qualquer sistema de classificação feito para ser estável por muito tempo coloca o categorizador na posição de previsor do futuro. Leitores atentos serão capazes de notar a diferença entra a frase A e a frase B.

A: “Eu te amo.”

B: “Eu sempre irei te amar.”

Ai da pessoa que profere a frase B quando o que eles quiseram dizer foi a frase A. A frase A é uma afirmação. A frase B é uma previsão. Mas este é o dilema ontológico. Considere as seguintes afirmações:

A: “Este é um livro sobre Dresden.”

B: “Este é um livro sobre Dresden,

e ele fica na categoria ‘Alemanha Oriental.”

Essa segunda frase parece tão óbvia, mas a Alemanha Oriental na verdade tornou-se uma categoria instável. Cidades são reais. Elas são fatos físicos, reais. Países são ficções sociais. É muito mais fácil para um país desaparecer do que uma cidade desaparecer, então quando você está dizendo que a pequena coisa está contida pela coisa grande, você está na verdade misturando radicalmente tipos diferentes de entidades. Nós fingimos que ‘país’ refere-se a uma área física da mesma forma que ‘cidade’ o faz, mas não é verdade, como podemos saber de lugares como a antiga Iugoslávia.

Existe uma categoria de nível máximo, você pode ter visto ela mais cedo no esquema da Biblioteca do Congresso, chamada Antiga União Soviética. O melhor que eles puderam fazer foi apenas adicionar “antiga” em toda aquela zona que eles previamente categorizaram como União Soviética. Não por que eles achassem que isso fosse a verdade sobre o mundo, mas por que eles não tinham staff suficiente para reorganizar todos os livros na estante. Essa é a restrição.

Parte II: O único grupo que pode categorizar tudo é todo mundo

“Meu Deus. Está cheio de links!”

Quando nós re-examinamos a categorização sem assumir as restrições físicas nem de hierarquia em disco ou em hierarquia no mundo físico, nós temos respostas muito diferentes. Digamos que você quer mesclar duas bibliotecas – a minha e a Biblioteca do Congresso. (Você pode dizer que a Biblioteca do Congresso é a da direita, por que eles tem alguns livros a mais que eu).

[ Duas Coleções Categorizadas de Livros ]

Então como fazermos isso? Eu preciso sentar com a Biblioteca do Congresso e dizer, “Bem, no meu mundo, Python in A Nutshell é um trabalho de referência, e eu mantenho todos os meus livros sobre criatividade juntos”. Eu preciso evidenciar a diferença entre o meu esquema de categorização e o deles antes que a Biblioteca do Congresso seja capaz de levar meus livros?

Não, claro que não precisamos fazer nada do tipo. Eles são capazes de levarem meus livros enquanto ignoram minhas categorias, por que todos os meus livros tem ISBN. Eles não estão mesclando num nível categórico. Eles estão mesclando ao nível de item globalmente único. Minhas entidades, meus livros unicamente etiquetados, entram no esquema da Biblioteca do congresso trivialmente. A presença de etiquetas únicas significa que mesclar bibliotecas não requere a mescla de esquemas de categorização.

[ ISBNs Mescladas ]

Agora imagine um mundo onde tudo pode ter um identificador único. Isso deveria ser fácil, uma vez que é o mundo em que atualmente vivemos – a URL nos arranja um modo de criar uma ID globalmente única para o que quer que precisemos apontar. Às vezes os apontadores são diretos, como quando uma URL aponta para os conteúdos de uma Web page. Às vezes são indiretas, quando você usa um link da Amazon para apontar para um livro. Às vezes existem camadas de indireção, como quando você usa uma URI, uma fonte identificadora uniforme, para nomear algo que tem uma localização indeterminada. Mas o esquema básico nos dá modos de criar um identificador único globalmente pra tudo.

E uma vez que você faça isso, qualquer um pode etiquetar esses apontadores, pode etiquetar essas URLs, de modos que os façam mais valorosos, e tudo sem requerir esquemas top-down de organização. E isso — uma explosão da livre forma de etiquetagem de links, seguido por todos os tipos de busca de valor dessas etiquetas — é o que eu acho que está ocorrendo agora.

Grandes mentes não pensam parecido

Este é o del.icio.us, o serviço social de bookmarking (favoritos) de Joshua Shachter. É para pessoas que querem cuidar de suas URLs sozinhos, mas que querem compartilhar globalmente uma visão do que estão fazendo, criando uma visão agregada de todos os favoritos dos usuários, bem como uma visão pessoal para cada usuário.

[ Página Inicial do del.icio.us ]

Como você pode ver aqui, as características de uma entrada no del.icio.us são um link, uma descrição estendida opcional, e um conjunto de tags, que são palavras ou frases que os usuários anexam a um link. Cada usuário que adiciona um link ao sistema pode dar a ele um conjunto de tags – alguns o fazem, outros não. Anexadas a cada link na página inicial estão as tags, o nome do usuário que a colocou, o número de outras pessoas que adicionaram o mesmo link e o tempo.

As tags são simplesmente etiquetas para URLs, selecionadas para ajudar o usuário na recuperação posterior dessas URLs. As tags tem o efeito adicional de agruparem URLs relacionadas. Não há um conjunto fixo de categorias ou escolhas oficialmente aprovadas. Você pode usar palavras, acrônimos, números, o que fizer sentido pra você, sem se preocupar com as necessidades, interesses ou requerimentos de ninguém mais.

A adição de algumas simples etiquetas dificilmente parece tão momentânea, mas a surpresa aqui, bem como geralmente é com a Web, é a surpresa da simplicidade. Tags são importantes principalmente pelas coisas que elas deixam de fora. Por ir além da classificação formal, as tags permitem uma grande quantidade de valor organizacional produzido pelo usuário, a um custo impressionantemente pequeno.

Existe uma comparação útil entre o gopher e a Web, onde o gopher era melhor organizado, melhor mapeado a práticas institucionais existentes, e intrínsecamente inadequado para se trabalhar numa escala de internet. A web, em contraste, foi e é uma completa bagunça, com apenas uma marca de apontador, a URL, e nenhum mecanismo para organização global ou fontes. A web é geralmente notável por duas coisas – a forma que ignorou a maioria das teorias de hipertexto e metadados ricos, e como funciona melhor do que qualquer uma das alternativas propostas. (As estratégias Yahoo/Google que mencionei mais cedo também entram nessas linhas).

Com essas mudanças em andamento, aqui estão algumas das coisas que eu acho que estão aparecendo, como vantagens de sistemas de tags:

Lógica de Mercado – Como nos acostumamos à falta de restrições físicas, enquanto internalizamos o fato de que não existem prateleiras e não existem discos, nós estamos indo em direção à lógica de mercado, onde você lida com motivação individual, mas valor de grupo.

Como o Schachter diz do del.icio.us, “Cada esquema de categorização individual vale menos do que um esquema de categorização profissional. Mas existem vários, vários outros deles”. Se você achar um modo de fazer que a etiquetagem seja valorosa para os indivíduos, você gerará muito mais dados sobre qualquer objeto do que se você pagasse um profissional para etiquetar uma vez apenas. E se você pode encontrar qualquer modo de criar valor de combinar uma miríade de classificações amadoras ao longo do tempo, eles serão mais valorosos do que esquemas de categorizações profissionais, particularmente com relação à robustez e custo de criação.

O outro valor essencial da lógica de mercado é que as diferenças individuais não precisam ser homogenizadas. Busque pela palavra “gay” em quase qualquer categoria de nível alto. Você não irá achá-la, mesmo, como um princípio de organização para um grande grupo de pessoas, essa palavra importe muito. Usuários não participam desse tipo de discussões sobre esquemas tradicionais de categorização, mas com a etiquetagem, qualquer um é livre para usar as palavras que ele ou ela pensa que sejam apropriadas, sem ter de concordar com ninguém mais sobre como algo “deveria” ser etiquetado. A lógica de mercado permite que vários pontos distintos de visão co-existam, por que permite que indivíduos preservem seu ponto de vista, mesmo em face de um desacordo geral.

Usuário e Tempo são Atributos centrais – Isso é absolutamente essencial. A atitude do ontologista do Yahoo e de sua equipe foi — “Nós somos o Yahoo, nós não temos preconceitos. É assim que o mundo funciona. O mundo é organizado em uma dúzia de categorias”.

Aqui, por que você pode derivar ‘isso é quem esse link é foi etiquetado por’ e ‘isso é quando foi etiquetado, você pode começar a fazer inclusão e exclusão acerca de pessoas e tempo, não apenas tags. Você pode começar a fazer agrupamento. Você pode começar a decair. “Deixe-me ver as tags desse grupo de usuários, eu queria ver sobre o que eles estão falando” ou “Me dê todas as tags com essa assinatura, mas qualquer coisa que seja mais velho do que uma semana ou um ano”.

Isso é etiquetagem em grupo – não toda a população e não apenas eu. É como permissões do Unix – agora mesmo temos tags para usuário e mundo, e esta é a base na qual estaremos inventando etiquetas de grupos. Nós vamos começar a ser capazes de fazermos subconjuntos de nossos esquema de categorização. Ao invés de ter categorizações massivas e então categorização especializada, nós teremos um espectro entre elas, baseado no tamanho e feitura de vários grupos de etiquetagem.

Perda de Sinal da Expressão – A perda de sinal em esquemas de categorização tradicionais vem da compressão de coisas em um número restrito de categorias. Com a etiquetagem, quando há perda de sinal, ele vem de pessoas que não tem nada em comum ao falar de determinado assunto. A perda é da multiplicidade de pontos de vista, ao invés de compressão em torno de um único ponto de vista. Mas num mundo onde pontos de vista suficientes podem prover algum tipo de comundade, a perda de sinal agregado cai em escala em sistemas de etiquetagem, enquanto cresce em escala em sistemas com únicos pontos de vista.

A solução para este tipo de perda de sinal é o crescimento. Esquemas bem administrados bem organizados ficam piores com escala, tanto por que os custos em apoiar tais esquemas em largos volumes são proibitivos, e, como notei mais cedo, a escala ao longo do tempo é também um problema sério. Etiquetagem, ao contrário, fica melhor em larga escala. Com uma multiplicidade de pontos de vista a questão não é mais “Está todo mundo etiquetando os links ‘corretamente’”, mas “Está todo mundo etiquetando como eu?”. Ao longo que pelo menos uma pessoa etiquete algo do mesmo modo que você, você achará – usando um tesauro para forçar as etiquetas de todo mundo em uma sincronicidade mais afiada na verdade pioraria o ruído que você conseguiria com seu sinal. Se não existem estantes, então mesmo imaginar que existe um modo certo de organizar as coisas é um erro.

A filtragem é feita Post Hoc – Existe uma analogia aqui com cada jornalista que já olhou a Web e disse “Bem, isso precisa de um editor”. A web tem um editor, e é todo mundo. Num mundo onde publicações são caras, o ato de publicar é também um atestado de qualidade – o filtro vem antes da publicação. Num mundo onde publicação é barato, colocar algo a mostra não diz nada sobre sua qualidade. É o que acontece depois que é publicado o que importa. Se as pessoas não apontam pra ele, outras pessoas não lerão. Mas a idéia que a filtragem seja depois da publicação é incrívelmente forasteira para os jornalistas.

Similarmente, a idéia de que a categorização é feita depois de as coisas serem etiquetadas é incrívelmente estranha para catalogadores. Muito do gasto de sistemas de catalogação existentes está na tentativa de prevenir categorias únicas. Com etiquetagem, o que você diz é “Contanto que várias pessoas estejam etiquetando qualquer link, as tags raras podem ser usadas ou ignoradas, com o gosto do usuário. Nós não precisaremos nem aumentar o custo para prevenir que as pessoas o usem. Nós só ajudaremos outros usuários a ignorá-las se quiserem”.

Novamente, escala vem salvar o sistema de um modo que simplesmente quebraria os esquemas de catalogação tradicionais. A existência de uma etiqueta esquisita ou incomum é um problema se é a única forma que um determinado link possa ser etiquetado, ou se não há outra forma de um usuário evitar esta tag. Uma vez que o link foi etiquetado mais de uma vez, no entanto, usuários podem ver ou ignorar as tags esquisitas como bem querem, e a decisão sobre quais tags a serem usadas surgirão após os links já terem sido etiquetadas, não antes.

Mesclados de URLs, não Categorias – Você não mescla esquemas de etiquetagem no nível de categoria e então vê quais são os conteúdos. Com a idéia de mesclar ISBNs, você mescla conteúdos individuais, por que nós agora temos URLs únicas. Você mescla das URLs, e então tenta derivar algo sobre a categorização a partir daí. Isso permite que mesclagens parciais, incompletas ou propabilísticas que são melhores encaixem-se em ambientes incertos – tais como o mundo real – do que esquemas rígidos de classificação.

Mesclagens são Probabilísticas, não binárias – Mesclagens criam uma sobreposição parcial entre tags, ao invés de definirem tags como sinônimos. Ao invés de dizerem que qualquer tag “é” ou “não é” o mesmo que outra tag, o del.icio.us é capaz de recomendar tags relacionadas dizendo “Várias pessoas que etiquetaram isso como ‘Mac’ também etiquetaram como ‘OSX’”. Mudamos de uma escolha binária entre dizer que duas tags são a mesma ou diferente a opção do diagrama de Venn de “tipo/de alguma forma é/tipo é/sobrepõe neste grau”. Essa é uma mudança realmente profunda.

Distribuições de Tag no del.icio.us

Aqui está algo que demonstra o que quero dizer sobre o fim da categorização binária.

[ Tags por usuário ]

Essa é uma tabela baseada numa pequena amostra de links da página inicial do del.icio.us, tirada durante um intervalo de 2 horas. O eixo X são os 64 usuários que postaram links durante esse período. O eixo Y é o número total dos tipos discretos de tags que esses usuários já usaram em sua história no del.icio.us

A tabela mostra uma grande variedade em estratégias entre os vários usuários. O usuário da extrema esquerda tem um enorme número de tags únicas, quase 600. E então existe esse grupo de pessoas que não são etiquetadores muito ativos mas que tem algumas tags, e claro na direita deles há a cauda longa característica de pessoas que usam bem menos tags do que os etiquetadores ativos. (Uma vez que é só uma imagem de duas horas, existe uma tendência natural sobre usuários frequentes do del.icio.us. Estou tentando conseguir um conjunto mais amplo de informações. Minha opinião é que a cauda vai um pouco mais longe que isso). Mas é assim que a organização se parece quando você a entrega aos usuários — várias estratégias diferentes, cada uma funciona em seu próprio contexto, mas que também pode ser mesclada.

[ Tags de um único usuário ]

Essas são as tags de um único usuário. Daqui, você pode dizer algo sobre essa pessoa — ele ou ela é obviamente um programador de Flash — a tag mais comum aqui é Flash, seguido por um número de outras tags frequentes principalmente relacionadas a programação. Como a página inicial, essa distribuição tem a assinatura orgânica. Especialistas não catalogam assim; especialistas, que aprendem como catalogar produzem etiquetagens bem mais consistentes. Aqui, é o que quer que o usuário pensou que pudesse ajudá-lo a lembrar do link depois.

Você pode ver que há uma tag “to_read” (“para_ler”). Um catalogador profissional olharia pra essa tag horrorizado — “Isso é dependente de contexto e temporário”. Bem, também era a categoria “Alemanha Oriental”. Uma vez que você expande a sua escala de tempo para incluir a vida real da categorização do esquema em si, você reconhece que a distinção entre temporário e permanente é terrivelmente vaga. Não há na verdade uma condição binária de uma tag que não possa sobreviver a qualquer tipo de uma examinação a longo prazo.

[ ‘Assinaturas’ diferentes de tags para diferentes URLs ]

E então existe esse conjunto de gráficos. Isso é pra mim a mais interessante e menos compreendida parte do del.icio.us agora mesmo — essas são duas URLs diferentes e as tags que um grupo inteiro de usuários aplicou a elas. O gráfico embaixo refere-se a um site para download de antigas versões de programas que não são mais distribuídos. Você pode ver aqui que há um amplo consenso comum. 140 pessoas etiquetaram Software. Então, a próxima tag em comum, com apenas 20 ocorrências é Windows e então Velho, e Download, e assim por diante. Para essa URL, há um consenso núcleo — esse link é sobre software — e depois desse pequeno pedaço de comunidade, há uma queda muito brusca das tags.

O gráfico no canto superior direito, em contraste, mostra as tags para uma página detalhando como incorporar pesquisas permanentes no Gmail. Você pode ver as tags — Gmail, Firefox, Search, Javascript, GreaseMonkey — essa é uma distribuição muito mais dispersa, com uma queda muito menor. A visão de consenso é que esse link é sobre mais tipos de coisas do que o link de download de software é, ou, ainda, ocupa mais contextos para os usuários do del.icio.us do que o link de download de software.

Olhando para esse tipo de informação, nós podemos começar a dizer, de URL particulares, que os usuários etiquetando essa URL centralizaram ou não acerca de uma tag núcleo, com seu grau de certeza, e, graças aos moldes temporais, nós podemos até começar a entender como a distribuição de tags de URL muda através do tempo. Foram 5 anos entre espalhar o link e o Google perceber como usar coleções inteiras de links para criar valor adicional. Estamos no início do uso de etiquetas, então nós ainda não temos conjuntos amplos e de longa data de informações para olharmos, mas eles estão sendo construídos rapidamente, e nós estamos começando a descobrir como extrair um novo valor de coleções inteiras de etiquetas.

A Organização torna-se orgânica

Estamos mudando da categorização binária — livros são ou não são entretenimento — para esse mundo probabilístico, onde N% dos usuários pensam que livros são entretenimento. Pode até ser que dentro do Yahoo, tenha existido um grande debate sobre livros serem ou não entretenimento. Mas esse debate não se refletiu de nenhuma forma ou eles decidiram não expôr isso aos usuários. O que aconteceu ao invés disso foi que isso se tornou uma categorização tudo ou nada, “Isso é entretenimento, isso não é”. Nós estamos deixando de lado esse tipo de declaração absoluta, e seguindo na direção de sermos capazes de desenvolver esse tipo de valor observando como as pessoas lidam com isso na prática.

Aparece ultimamente como uma questão filosófica. O mundo faz sentido ou nós fazemos o sentido do mundo? Se você acredita que o mundo faz sentido, então qualquer um que tente fazer sentido do mundo diferentemente de você está lhe apresentando uma situação que precisa ser reconciliada formalmente, por que se você entendê-la errado, você está entendendo o mundo de forma errada.

Se, por outro lado, você acredita que nós fazemos sentido do mundo, se nós estamos, de um bando de diferentes pontos de vista, aplicando algum tipo de sentido ao mundo, então você não precisa privilegiar uma categoria em detrimento de outras. O que você faz ao invés disso é tentar achar modos que o sentido individual possa desenvolver-se para algo que é de valor agregado, mas você faz isso sem um objetivo ontológico. Você faz isso sem um objetivo de explicitamente tentar ou até mesmo combinar alguma visão teoricamente perfeita do mundo.

Criticamente, a semântica aqui está nos usuários, e não no sistema. Esse não é um modo de fazer com que os computadores entendam as coisas. Quando o del.icio.us está me recomendando etiquetas, o sistema não está dizendo “eu sei que o OSX é um sistema operacional. Entretanto, eu posso usar lógica predicada para aparecer com recomendações — usuários usam software, software é usado em sistemas operacionais, OSX é um tipo de sistema operacional — e então dizer ‘Aqui Sr. usuário, você pode gostar destes links”.

O que ele está fazendo ao invés disso é muito mais simples:”vários usuários etiquetando coisas como foobar também estão etiquetando coisas como forbnitz. Eu direi ao usuário que foobar e frobnitz são relacionados”. Cabe ao usuário decidir se aquela recomendação é ou não útil — del.icio.us não faz idéia do que aquela etiqueta significa. A sobreposição da etiqueta está no sistema, mas a semântica está nos usuários. Essa não é uma forma de injetar significado linguístico na máquina.

Tudo é dependente do contexto humano. Isso é o que estamos começando a ver com del.icio.us, com o Flickr, com sistemas que estão permitindo e agregando tags. O benefício notório desses sistemas é que eles não recriam a categorização estruturada e hierárquica que geralmente nos é forçada pelos nossos sistemas físicos. Ao invés disso, estamos lidando com um rompimento significativo — por deixar os usuários etiquetarem URLs e agregarem essas etiquetas, nós seremos capazes de construir sistemas organizacionais alternados, sistemas que, como a Web em si, fazem um trabalho melhor de deixar individuos criarem valor uns para os outros, geralmente sem perceber isso.

Muito Obrigado.

Obrigada a Alicia Cervini pela inestimável ajuda editorial.

Tradução livre: Isadora Garrido. Revisão superficial: Fabiano Caruso.

Original disponível no Clay Shirky’s Writings About the Internet

Divisão de gênero na taxonomia de e-commerce: impacto na conversão?

Há algum tempo atrás me mandaram um link avisando que na Amazon tinha caído a distinção de gênero em brinquedos para meninos e meninas, como segue abaixo:

amazon-gender-toys
A seção de meninos e meninas (em amarelo) caiu, parece. Imagem do Kottke.org

Pessoalmente, acho a decisão da empresa muito boa e acredito que isso demorou pra acontecer. Mas ela ainda não deixa de ser bastante polêmica. Não sei se existem dados concretos em relação a converter mais ou menos venda, mesmo porque grandes empresas costumam ser conservadoras e ninguém nunca se arriscou ao ponto de verificar se isso impacta ou não.

Imagino que deve impactar sim, porque as pessoas – generalizando bem e bastante – não estão preparadas para lidar com a não-divisão de gênero. Mas acredito que esse primeiro passo precisa ser dado. A Amazon parece que está sendo pioneira nisso e há algum tempo fiquei sabendo que a Target tinha feito o mesmo também.

As grandes lojas de departamento estão começando essa movimentação, mas se formos analizar a organização das lojas especializadas, ainda falando de brinquedos, como a Toys’r’us, Disney Store e Bebê Store, essa faceta binária para gênero ainda existe (mas na FAO Schwarz e na Hamleys, outras duas grandes lojas de brinquedos, não existe, por exemplo). Algo parecido aconteceu com a campanha Amazon Mom que foi substituída pela Amazon Family.

Acredito que esta não seja uma questão de ser politicamente correto ou não, mas de simplesmente acreditar em um mundo que seja mais diverso, menos restritivo. A mera abolição do uso de gênero não promove de nenhum modo uma maior conscientização do que isso efetivamente significa, embora este primeiro passo seja muito importante.

Apesar de acreditar e inclusive verificar que formas de organização podem moldar o mundo politicamente, não acredito que seja através dela que será possível ocorrer um entendimento mais profundo acerca de respeito às individualidades e à compreensão da diversidade, enquanto um valor intrinsecamente humano.

Índice de passaportes do mundo todo

Sempre tive curiosidade com características e particularidades de países do mundo todo e adoro listas. Há algum tempo atrás me deparei com um site que gostei bastante: trata-se de uma ferramenta interativa que coleciona, exibe e cria o ranking de passaportes do mundo todo: o Passport Index.

Criado pelo Arton Group, os filtros (ou facetas) são divididos por país, por localidade, por cor (!!!) e por ranking de influência do passaporte. Achei curioso existirem apenas quatro cores principais (e dentro dessas cores diferentes tonalidades, etc.) para passaportes e imagino se por trás dessas cores exista algum significado – no site não tem essa informação.

As imagens das capas de todos os passaportes são selecionadas via crowdsourcing (contribute@passportindex.org). Sobre o ranking, ele é baseado na influência de determinado passaporte ou seja, em quantos países o seu portador pode visitar sem a necessidade de visto antecipadamente, ou podendo obter o visto na chegada. Quanto maior for o número de países onde o acesso não necessita visto, melhor é o ranking do passaporte.

A lista foi baseada nos 193 países membros das Nações Unidas e 6 territórios (Macao, Kosovo, etc.) com um total de 199 países. Territórios anexados a outros países tais como a Ilha Norfolk, Polinésia Francesa, foram excluídos. No site ainda existe o seguinte aviso:
Esta ferramenta foi criada com informação disponível publicamente ou com conteúdo enviado por indivíduos. Embora as informações sejam baseadas em pesquisa de fontes públicas, bem como informações compartilhadas por agências do governo, certas suposições foram feitas e os resultados são apenas estimativas.  Esta ferramenta não deveria ser utilizada para planejamento de viagens. Respectivos consulados ou embaixadas devem ser consultados referentes às políticas de visto para o país.
Enfim. Tem várias coisinhas que acredito que poderiam ser melhoradas no site pra uma melhor visualização. Na página inicial os passaportes estão em ordem alfabética, o que é ótimo. Mas ao invés de, por exemplo, clicar em cada uma das capinhas pra que elas se abrissem seria mais prático se eu pudesse clicar com a seta do teclado para a direita e a próxima capa já aparecesse – ao invés de eu ter de clicar em uma por uma. Ninguém quer ficar clicando.
Também seria mais legal se tivesse mais informações sobre os países no site. Uma opção preguiçosa seria um simples link pra Wikipédia ou até mesmo para a embaixada dos respectivos países. Uma opção trabalhosa seria criar uma página com um pequeno histórico e atualidades sobre aquele país em específico.
Outra coisa que seria interessante ter informações sobre – por mera curiosidade mesmo – é o histórico dos brasões ou o significado (se houver) de cada um dos símbolos das capas. Eu sei da história da folha na capa da Nova Zelândia porque acabei lendo sobre isso. Mas aposto que todas as outras capas que gostei tem significados próprios, que já poderiam estar à mão próprio no site.
E também tem um outro detalhe: se não me engano, passaportes que tem aquele retângulo com a bolinha no centro em algum lugar do seu design, é porque pertencem a algum bloco econômico – estou chutando. Talvez não seja isso, mas enfim… é porque trata-se de um passaporte biométrico, ou seja, possui um chip com todas as informações do passaporte (obrigada, Heitor!). Este seria um outro tipo de faceta ou filtro que poderia estar no site. Já que é pra categorizar, categorizemos, pois.
De qualquer modo, o Passport Index é uma ferramenta muito boa a princípio, mas que pode melhorar bastante fazendo uma adaptação ou outra.
Seguem as capinhas de passaporte que mais gostei:
cyge
iemn
senz
Eu gosto bem de vermelho, né?

Haverá futuro? Já está tendo

Eu ia fazer este comentário no post do Gustavo no BSF, O futuro da biblioteconomia (Oi Gustavo!), mas ele ficou muito longo então decidi publicá-lo aqui. Algumas afirmações que o Gustavo fez me inquietaram e eu resolvi inventar de pensar sobre elas.

O que faz um bibliotecário que uma máquina não pode fazer melhor (ainda)?

Coloquei o ainda entre parenteses porque se a gente for pensar em ficção científica, no futuro não haverá o que as máquinas não façam melhor que nós. Inclusive emular afetos (alguém lembra do filme “Her”?)

maxresdefault
Pareço apaixonado, mas estou aqui, pensando em quando não vou mais precisar catalogar, classificar e indexar.

Enquanto este dia não chega, minha resposta pessoal e atual é a seguinte: nossa semântica ainda é superior a das máquinas e temos a capacidade de imaginar e dar significado às coisas do mundo (dados, informações e principalmente afetos). Uma máquina – ainda – não é dotada de afetividade. Regras não se criam sozinhas: ainda são criadas e entendidas por humanos para assim serem ensinadas às máquinas que as executam (mesmo em se tratando de inteligência artificial).

O que não pode acontecer é a catalogação, classificação e indexação serem superestimadas (já traduzi texto sobre isso também, Ontologias são superestimadas, do Clay Shirky) em detrimento do contexto e do significado. Mas acredito que podemos continuar estudando essas disciplinas e entendê-las em outros contextos, para que elas nos possam ser úteis e para que possamos trabalhar com elas de uma forma que seja melhor aproveitável. E acredito que isso possa ser feito.

Se isso deixar de ser, vamos supôr: se essas “matérias duras” deixarem de ser efetivamente estudadas e ministradas, a área não corre o risco de descaracterizar-se e se tornar um curso genérico? Vai virar uma administração/gestão apenas? Vai virar soft programming? Vai virar o quê? Uma área interdisciplinar sem denominação definida? O que vocês têm para substituir, efetivamente, a biblioteconomia? Gestão da Informação? Várias tentativas de acabar com a biblioteconomia tem sido realizadas ao longo dos anos e até então não vi nada acontecendo.

c7a2c63a444a796cda2bffb4119bf068
A biblioteconomia acabou. O mundo está automatizado. Ninguém mais precisa de livros, nem de mediação para absolutamente nada. O que nos resta? O que será de nós?

Sou a favor da crítica, mas não gosto de discursos muito apocalipticos. “A internet matou a TV”, “O rádio morreu”, “a biblioteconomia acabou”. Prefiro dar tempo ao tempo e só afirmar coisas quando elas efetivamente acontecem, jamais antes disso. Imperativos forçados não são suficientes pra explicar um contexto que geralmente é mais complexo do que conseguimos imaginar. Ou talvez sou eu que sempre insito em ver o copo sempre meio cheio. Ouço que “a biblioteconomia está com os dias contados” desde que tive a intenção de fazer o curso, há coisa de 10 anos atrás. Estou esperando até agora o curso acabar e curiosamente vejo o oposto: não termina, mais turmas são formadas e a profissão, apesar de todos os pesares, está sendo popularizada. Pessoalmente, acho isso positivo.

Toda vez que alguém cria uma ontologia morrem vagas de bibliotecários.

Desculpe mas eu discordo.

Bibliotecários podem saber programar? Sim e pode ser excelente quando sabem. Mas bibliotecários não são programadores.

E discordo porque o que tenho vivenciado profissionalmente é bem diferente do que o que essa frase diz. Bibliotecários – se bem formados e que tenham um interesse real na profissão – possuem o mindset necessário para conversar de igual pra igual com outros profissionais de tecnologia, oferecendo insights que geralmente não são o foco de quem é de TI, por exemplo. É uma questão de perfil profissional: programadores entendem ontologias e a própria organização de dados e de informação de forma completamente diferente de bibliotecários, desconsiderando uma série de fatores de busca e pesquisa por parte dos usuários (User Experience é parte disso).

Catalogação, classificação e indexação não devem parar de ser ensinadas. Devem ser MELHOR ensinadas. E isso é dramaticamente diferente.

Giuliano-Santoro-cervelli-sconnessi
Classificação, catalogação e indexação são atividades que podem ser utilizadas em outros contextos, não apenas em bibliotecas.

Programadores são de exatas: se preocupam com o input e raramente se preocupam com o output, com a outra ponta humana que busca a informação. Eles estão bem mais preocupados com definições de regras e de aterem-se a elas do que nós, inclusive. A definição de regras pra um algoritmo jamais é imparcial e é enviesada pela visão de mundo de quem o cria. Se essa é uma visão exclusiva de TI, ela torna-se quadrada e tendenciosa, desconsiderando outros aspectos importantes na busca e no que chamam de encontrabilidade da informação.

Bibliotecários e outros profissionais (que entendem de SEO e também linguística) podem fazer a ponte com programadores entre algo que é estático e exato e torná-lo mais acessível, explorando outras possibilidades. No meu trabalho observo isso diariamente e minha equipe desenvolve pesquisa justamente para refinar e melhorar o que seria uma ontologia (ou taxonomia, enfim), tendo em vista principalmente a otimização do negócio.

Novamente: organização da informação, hoje, mais do que jamais foi, é trabalho de bibliotecário sim!

Ainda mais se considerarmos o meio digital. Ouviram falar que a Apple contratou curadores humanos para substituir o aplicativo de recomendações? Por que uma empresa de tecnologia de ponta faria isso? Meu chute é porque humanos ainda são relevantes para humanos.

ai-ux-biblio-672x342
Aprender uma coisa não impede que você continue aprendendo outras e inclusive aprendendo melhor.

Pode não ser o trabalho tradicional de bibliotecário como o conhecemos (como já escrevi no BSF o post Bibliotecários Lato e Strictu Sensu), mas posso dizer com toda a certeza que se eu não tivesse um verdadeiro interesse em compreender de fato as teorias sobre organização da informação, eu jamais teria insumos suficientes pra entender e fazer o que faço hoje em dia. Jornalismo não me ensinaria o que Biblioteconomia me ensinou, por exemplo.

Acredito que o currículo do curso precisa mudar? Sim, bastante.

Acredito que existe tecnofobia na biblioteconomia? Existe muito.

Mas também isso não me inviabilizou em nenhum momento em ter interesse pelo assunto.

O que acontece, hoje, é o que o aluno de biblioteconomia ao invés de poder aprender sobre tecnologia logo durante a graduação, precisa ter um duplo-esforço: aprender apenas a teoria na graduação, aprender sobre tecnologia apenas no mercado e literalmente se virar pra fazer a ponte entre estes dois mundos. Isso é tanto um desafio (pois a pessoa inevitavelmente acaba aprendendo mais coisas e inclusive se desanimando com o curso no meio do caminho) quanto uma bela de uma gambiarra acadêmica (pois os cursos definitivamente já precisariam estar atualizados e ter melhor qualidade).

Devemos estudar mais psicologia e menos linguagens documentárias.

Discordo novamente.

Uma coisa não exclui nem mesmo invalida a outra. Devemos estudar mais psicologia E melhores linguagens documentárias, pois elas estão interligadas.

Devemos estudar sobre qualquer assunto que nos interesse (inclusive catalogação, classificação e indexação, se assim o quisermos) e agregue ao que já temos domínio. Não acho bom vetar nenhum estudo (por mais inútil que ele pareça) mas sim direcioná-lo de forma explorar possibilidades futuras. Aprendizagem é isso.

As especializações em várias áreas (aqui em São Paulo, na FESPSP tem Gestão Arquivística, Gestão da Informação Digital – que estou concluindo -, Gestão de Serviços de Informação entre outros e no SENAC tem Gestão da Comunicação em Mídias Sociais e Gestão Estratégica do Conhecimento e Inovação; inclusive em outros cursos, nem precisa ser em Ciência da Informação) e educação continuada na área – ExtraLibris Cursos e Class Cursos – estão aí pra isso mesmo. Nenhum profissional realmente interessado vai se limitar e se contentar apenas com o pouco que foi aprendido na graduação: isso faz parte da horizontalização e amplitude do conhecimento. No entanto, essa é uma escolha estritamente pessoal.

Minha escolha é não adotar uma postura pessimista em relação às minhas escolhas, verificar o que pode ser melhorado e tentar participar e discutir sobre isso sempre que possível.