MAPA16: FTP Compresion de Archivos
"Viajar es hermoso solo en retrospectiva." Paul Theroux, en The Observer
Todo aquel que tiene una computadora sabe que la cantidad de espacio de disco es
limitada. Una manera de solucionar este problema es usar un software que "comprima"
los programas que no se usan, dejando libre parte del disco para otros programas.
Resulta que los problemas de espacio de disco no se limitan a las computadoras personales. Como la cantidad de archivos disponibles via ftp crece diariamente, los sitios ftp buscan continuamente nuevas formas de comprimir mas archivos en una cantidad limitada de espacio. Los sitios ftp lo logran por medio de metodos de compresion de archivos.
Lo bueno es que un archivo comprimido ocupa muchisimo menos espacio en la computadora del sitio ftp. Lo malo es que un archivo comprimido es completamente inutil a menos que se lo descomprima.
Y hay mas malas noticias... Para poder descomprimir un archivo, tienen que saber en primer lugar que metodo se uso para comprimirlo. Lamentablemente, no hay un metodo de compresion de archivos estandar; hay CIENTOS demetodos diferentes en uso hoy en dia. : (
Ahora, ®como se van a dar cuenta que metodo se uso para comprimir un archivo? Bueno, en realidad es bastante facil.
1. La mayoria de los directorios ftp tienen un archivo "READ.ME" (o README, README.TXT, README-uploads, etc.) con un indice con todos los archivos de ese directorio. Algunos sitios ftp ofrecen tambien un "README" expandido donde se menciona que metodo de compresion se uso y donde se puede conseguir una copia del programa para descomprimir los archivos.
2. Observen las extensiones de los archivos. Comparandolas con la lista que encontraran mas adelante, van a poder determinar que metodo de compresion se uso y que software van a necesitar para descomprimirlo.
Por suerte, la mayoria de los programas para descomprimir archivos son de dominio publico (es decir, totalmente gratuitos) o bien "shareware" (se puede obtener una copia del programa gratis, pero el autor espera que le envien algo de dinero si deciden que darselo y usarlo). Y lo mejor de todo es que la mayoria de los programas de descompresion se pueden conseguir via ftp! :)
La lista que esta a continuacion muestra algunas de las extensiones mas populares que pueden encontrar en sus visitas a sitios ftp. Muestra ademas los modos de transferencia que hay que usar para recuperar archivos con estas extensiones, los programas que van a necesitar para descomprimir los archivos una vez que los bajaron y tiene ademas algunos comentarios adicionales sobre cada una de las extensiones.
Parafraseando algo que dije en el MAPA01: Bienvenidos, quiero que sepan que seguramente el metodo que no esta incluido en la lista va a ser el que a ustedes mas les gusta. Por favor, no se lo tomen como algo personal. Hay literalmente cientos de metodos de compresion en uso, y no hay forma de que pueda hablar sobre todos.
Sugerencia: Guarden esta lista y usenla como referencia para cuando encuentren una extension que no conocen. :) Ademas, observen que se habla acerca de "archie". Archie es una herramienta de busqueda via FTP de la que vamos a hablar en la proxima clase.
La lista fue adaptada -con autorizacion- de "The EFF's Guide to the Internet".
Extension del archivo: .txt o .TXT Modo de transferencia: ASCII Programa de descompresion:
---- Comentarios adicionales: No hace falta descomprimirlo; el archivo es un documento
y no un programa.
Extension del archivo: .ps o .PS Modo de transferencia: ASCII Programa de descompresion: ----- Comentarios adicionales: Es un documento PostScript (un lenguaje de descripcion de paginas de la empresa ADOBE). Pueden imprimir este archivo en cualquier impresora que interprete PostScript o usar un programa que lo muestre en la pantalla ("previewer"), como el programa GhostScript de GNU.
Extension del archivo: .doc o .DOC Modo de transferencia: ASCII Programa de descompresion: ----- Comentarios adicionales: Otra extension comun para documentos de texto, pero tengan cuidado: las extensiones .doc y .DOC tambien se usan para documentos de Microsoft Word (que son archivos binarios). No se necesita descompresion, a menos que este seguido por los dos puntos.
Extension del archivo: .Z Modo de transferencia: Binario Programas de descompresion: uncompress Comentarios adicionales: Es un metodo de compresion UNIX. Para descomprimir, escriban "uncompress nombre de archivo.Z". El "u16.zip" es un programa MS-DOS que permite bajar archivos .Z y descomprimirlos en nuestra maquina. El equivalente para Macintosh se llama MacCompress (usen "Archie" para encontrarlo).
Extension del archivo: .zip o .ZIP Modo de transferencia: Binario Programa de descompresion: PKZip o Zip/Unzip Comentarios adicionales: Indica que el archivo fue comprimido con un programa de compresion comun para MS-DOS conocido como PKZIP (usen "Archie" para encontrar el PKZIP204G.EXE o posterior). Muchos sistemas UNIX permiten "deszipear" un archivo con un prog rama llamado "unzip".
Extension del archivo: .gz Modo de transferencia: Binario Programa de descompresion: gunzip Comentarios adicionales: Version de ZIP para Unix. Para descomprimir, escriban "gunzip nombre de archivo.gz" en la linea de comando del servidor.
Extension del archivo: .zoo o .ZOO Modo de transferencia: Binario Programa de descompresion: zoo Comentarios adicionales: Formato de compresion para Unix y MS-DOS. Usen un programa llamado "zoo" para descomprimir.
Extension del archivo: .shar o .Shar Modo de transferencia: Binario Programa de descompresion: unshar Comentarios adicionales: Otro formato Unix. Usen "unshar" para descomprimir.
Extension del archivo: .tar Modo de transferencia: Binario Programa de descompresion: tar Comentarios adicionales: Otro formato Unix, frecuentemente utilizado para comprimir varios archivos relacionados entre si en un unico archivo. Todos los sistemas Unix tienen un programa llamado "tar" para descomprimir los archivos .tar. A menudo, estos ar chivos estan comprimidos tambien con el metodo "gz" (.tar.gz o .tgz), asi que van a tener que usar primero "uncompress" y despues "tar".
Extension del archivo: .sit o .Sit Modo de transferencia: Binario Programa de descompresion: StuffIt Comentarios adicionales: Formato para Macintosh.
Extension del archivo: .sea o .SEA Modo de transferencia: Binario Programa de descompresion: ----- Comentarios adicionales: Formato para Macintosh que es un archivo de autoextraccion. No se necesita programa de descompresion.
Extension del archivo: .bin o .BIN Modo de transferencia: Binario Programa de descompresion: MacBinary+ Comentarios adicionales: Formato para Macintosh que requiere MacBinary+ para descomprimir.
Extension del archivo: .ARC Modo de transferencia: Binario Programa de descompresion: ARC o ARCE Comentarios adicionales: Otro formato MS-DOS.
Extension del archivo: .LHZ Modo de transferencia: Binario Programa de descompresion: LHARC Comentarios adicionales: Otro formato para MS-DOS.
"Unas ultimas palabras de advertencia: fijense el tamaño de un archivo antes de bajarlo. La Red mueve informacion a velocidades excepcionales. Pero la transferencia de un archivo de mas de 500.000 bytes podria demorar mas de una o dos horas si se usa un modem de 2400 baudios. Ademas, el proveedor del servicio puede limitar la cantidad de bytes que se pueden guardar en cada sesion.
Por otra parte, aunque es muy poco probable que encuentren un archivo infectado con un virus, si piensan bajar muchos archivos via Internet, les conviene invertir en un buen programa antivirus, por las dudas."(1)
Ademas eviten bajar archivos con extensiones como ".sit" o ".hqx". Son archivos Macintosh que no corren en una PC.
FTPmail y Archivos Binarios
La clase pasada les mostre que es posible conseguir archivos via correo electronico
enviando un mensaje a alguna de estas direcciones:
Argentina ftpmail@ccc.uba.ar
Australia ftpmail@cs.uow.edu.au
Francia ftpmail@grasp.insa-lyon.fr
Alemania ftpmail@ftp.uni-stuttgart.de
Gran Breta§a ftpmail@doc.ic.ac.uk
Irlanda ftpmail@ieunet.ie
Suecia ftpmail@lth.se
EE.UU. ftpmail@sunsite.unc.edu
EE.UU. ftpmail@ftp.uu.net
EE.UU. ftpmail@decwrl.dec.com
con los siguientes comandos en el cuerpo del mensaje:
reply <direccion electronica>
connect <direccion del sitio ftp>
<modo de transferencia>
chdir <directorio>
get <nombre del archivo >
quit
Antes de empezar con los temas nuevos, hay un par de cosas que quisiera repasar.
Primero, el comando
reply <direccion electronica>
le dice a la direccion FTPmail donde quieren que envie el archivo. Si usan el ejemplo
que les di la clase pasada
reply crispen@campus.mci.net
connect rs.internic.net
ascii
chdir /internic/faq
get roadmap.faq
quit
No se olviden de cambiar la direccion, porque sino voy a ser yo el que reciba los
archivos en lugar de ustedes. :)
Ademas, el FTPmail los limita a un solo comando "CHDIR" por mensaje. Por ultimo, ¿recuerdan que les pedi que le preguntaran al proveedor de Internet si habia algun limite en el tamaño de los archivos? De ser asi, hay un comando adicional que tienen que agregar a la lista de comandos
chunksize <tamaño>
Este comando divide a los archivos en varios paquetes para que el sistema los pueda
manejar. Si el limite es de 50.000 caracteres por mensaje, el comando deberia ser
chunksize 49000
(asi se aseguran que los paquetes sean mas chicos que el limite permitido). Este
comando divide al archivo en paquetes de 49.000 caracteres que son los que uds. van
a recibir.
Ya saben como conseguir archivos ASCII usando FTPmail. En esta clase les voy a mostrar como bajar archivos binarios usando FTPmail.
Las transferencias de archivos binarios via FTPmail no son dificiles... solo requieren algunos pasos adicionales. Como todo lo que se envia por correo electronico debe estar en ASCII, el FTPmail tiene que codificar los archivos binarios en ASCII antes de enviarlos. Una vez que obtienen el archivo, tienen que decodificarlo nuevamente a binario.
Por suerte, el FTPmail puede codificar archivos binarios a ASCII de dos maneras. La primera es mediante algo llamado "uuencode". El proceso es simple siempre y cuando tengan un programa "uudecode" (los programas "uudecode" estan por todos lados, seguro que el sitio de ustedes tiene uno guardado en su sistema). El otro tipo de codificacion se llama "btoa" (Binario a ASCII). El proveedor les podra decir algo mas acerca de "btoa".
Entonces, para bajar archivos ASCII via FTPmail, tendriamos que usar los siguientes comandos en el cuerpo del mensaje:
reply <direccion electronica>
connect <direccion del sitio ftp>
ascii
chdir <directorio>
chunksize <size>
get <nombre del archivo>
quit
y para bajar archivos binarios via FTPmail, usariamos estos:
reply <direccion electronica>
connect <direccion del sitio ftp>
<uuencode o btoa>
chdir <directorio>
binary
chunksize <tama§o>
get <nombre del archivo>
quit
Tarea:
Tomense un recreo. Se lo ganaron. :)