Mostrando entradas con la etiqueta linux mint. Mostrar todas las entradas
Mostrando entradas con la etiqueta linux mint. Mostrar todas las entradas

GImageReader lector OCR simple y ligero

El reconocimiento óptico de caracteres expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos desde una imagen o por ejemplo de un PDF. En muchos casos tenemos una imagen o un PDF que contiene texto, bien obtenido desde una fotografía, o de un escaneo de un documento, y nuestra intención es obtener ese texto para poder ser usado en: un articulo, o en los apuntes de la escuela. Para evitar mecanografiar la fotografía, hay programas que son capaces de reconocer el texto que contiene el archivo gráfico, capturarlo y así poder ser exportado a otro documento, o permitir un copia-pega.


GImageReader es un lector OCR simple, ligero, gratuito y multi-plataforma para ordenador que nos facilitara la tarea de obtener texto de imágenes o de archivos PDF.

Las funciones que esta aplicación permite realizar son las siguientes:

  • Importar documentos PDF e imágenes desde el disco, dispositivos de escaneado, porta papeles y capturas de pantalla.
  • Procesar múltiples imágenes y documentos de una sola vez
  • Definir del área de reconocimiento manual o automática
  • Reconocer a texto sin formato o documentos hOCR
  • Mostrar el texto reconocido directamente junto a la imagen
  • Procesar el texto reconocido, incluida la revisión ortográfica
  • Importar documentos o imágenes cuyo texto se encuentre en diferentes idiomas
  • Generar documentos PDF a partir de documentos hOCR


- Generar documentos PDF desde el documento hOCR

  • Ubuntu

    Ubuntu: Disponible en ppa:sandromani/gimagereader
Se encuentra disponible en los repositorios de las principales distribuciones linux, y es posible instalarlo desde terminal:
  • Fedora:
yum install  tesseract tesseract-langpack-es gimagereader

  • Aprcity o derivados de Arch

yaourt -S gimagereader

  Si no tenemos tesseract instalado, toca ejecutar:

sudo pacman -S tesseract tesseract-data-eng tesseract-data-spa

    •  En Ubuntu y derivadas como Linux Mint

    sudo add-apt-repository ppa:sandromani/gimagereader

    sudo apt-get update

    sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-spa tesseract-ocr-eng

     El funcionamiento, como ya he dicho, es muy simple. En este caso vamos a hacer una captura de pantalla que contiene texto e imágenes, y vamos a digitalizar el texto para exportarlo a un PDF.

    Pegar imagen que ha sido copiada y capturada en el navegador

    Añadimos un archivo, pegamos una imagen o realizamos una captura de pantalla
    Se nos mostrara el documento seleccionado
    Podemos ajustar de forma manual el área que queremos capturar o dejar que el programa haga su magia y reconozca los textos que contiene.
    Si fuera necesario podemos manipular la imagen para aumentar o disminuir el brillo, contraste, resolución de pantalla, o invertir los colores.
    Una vez se muestran las áreas que contienen el o los texto que queremos digitalizar, le indicaremos en que idioma se encuentra escrito, gImageReader reconocerá el texto y nos mostrará a continuación los textos que ha reconocido. 
    Podremos copiarlo o guardarlo en en un archivo de texto plano, que nos permitirá manipular más tarde.
    En este caso te he descrito los pasos para una imagen, pero el potencial de la aplicación va más allá por que es capaz de digitalizar documentos PDF que no sean editable y exportarlo a un PDF que puedas modificar.
    Vista rápida de la captura de texto de una imagen

    Sistema de archivos con mayor compatibilidad entre Windows, Linux y Mac

    Cuando en el hogar, o en la oficina, utilizas distintos sistemas operativos Windows, Linux o Mac. Es muy importante dar un formateado con un sistema de archivos, compatible para nuestros discos duros y/o memorias externas.

    Recientemente he recuperado un disco duro de 80Gb y quería utilizarlo de soporte para copias de seguridad. Conectándolo a un sistema Linux, este caso Linux Mint, el montaje de la unidad y su lectura eran correctos, pero a la hora de conectarlo a un sistema Windows 11, este no lo reconocía.

    El sistemas mas compatible entre los distintos sistemas operativos es FAT32. Pero tiene la limitación que solo se pueden formatear con este sistema unidades de no mas de 4 GB.

    NTFS (Nueva Tecnología de sistema de archivos)es un sistema nativo de Windows, no es compatible en sistemas MAC y algunas distribuciones Linux.

    ext2, ext3 y ext4 son formatos que suelen utilizar de forma local las distribuciones Linux, y nos puede acarrear algún problema de lectura en sistemas Windows.

    exFAT:

    • Ventajas: Permite archivos grandes y es compatible con Windows, macOS y Linux.
    • Limitaciones: No es tan ampliamente compatible como FAT32.
    • Uso común: Buen formato para unidades externas compartidas entre diferentes sistemas operativos.


    Para poder realizar este formateo de una unidad externa USB al formato exFAT es necesario tener instalado la utilidad exFAT-utils
    sudo apt-get install exfat-utils

    Para saber donde se encuentra tu unidad USB alojada, puedes averiguarlo con el comando  

    df -h

     df  Informa  de  la  utilización del espacio de disco en sistemas de ficheros.

     -h Opción que muestra la capacidad de las carpetas solicitadas

    Una vez que nos hemos asegurado que la unidad se encuentra montada en nuestro sistema, procederemos a realizar el formateado de la misma

    sudo mkfs.exfat <ruta disco usb>

    DistroSea, probar distribuciones Linux desde el navegador

    Las distribuciones Linux tienen un gran particularidad, no hay dos iguales. Al ser un sistema operativo libre de modificaciones, cada organización o fundación crea distros muy distintas entre ellas. El usuario final, si no es un gran experto, puede encuentrase con un gran numero de posibilidades que abruman y asustan. ¿Que distribución elegir para mi entorno de trabajo? En vez de realizar una instalación nueva en nuestro equipo buscando la que mejor se adapte a nuestro gustos, podemos utilizar una versión en linea.



    Captura de pantalla de DistroSea



    DistroSea que reúne 64 sistemas operativos diferentes bajados en Linux. Estas distribuciones se pueden probarse desde el navegador sin tener que realizar ninguna instalación en nuestro equipo o en un virtualizador. Su utilización es gratuita, no es necesario registrase, aunque se puede realizar donaciones. Las versiones que se virtualizan son LiveCD, al menos la que pude probar, Fedora.


    Página de comprobación de nuestra dirección ip

    Es posible que si el servidor se encuentra saturado, tengas que esperar un ratito en la cola

    Somos lo primeros en la cola y podemos probar la distro Fedora


    Una vez que la cola de ejecución se encuentre libre, se te abrirá a pantalla completa la ejecución online del sistema operativo que quieras testear. Recuerda que no es una versión completa, no tiene acceso a Internet y no podrás guardar sesión.


    Captura de pantalla de la virtualización online a pantalla completa de Fedora

    Captura de pantalla al lanzar la instalación del cd live virtualizado


    Si te has cansado de "jugar" con la prueba de la distro online solo tendrás que "apagar" el sistema operativo, virtualizado para regresar al menú principal

    Te dejo la lista de las distribuciones a la s que da soporte hasta ahora y los enlaces a los sitios oficiales, por si quieres más información

    Dentro de estas 64 distribuciones se encuentra diferentes versiones, y diversos escritorios. Unos desarrolladores dan más enfassis a la elegancia, otros a la funcionalidad y sencillez, otros a que su apariencia sea la más parecidas al escritorio de Windows o al escritorio de Mac, o que el entorno gráfico sea lo más liviano posible para que se pueda instalar en ordenadores de bajos recursos:

    gThumb con soporte de imagen HEIF / HEIC, AVIF y JXL

    Si utilizas un Iphone como smartphone y sistema linux para tu ordenador, habrás comprobado que es como mezclar agua con aceite. Es más fácil integrar, por ejemplo, Ubuntu en un Windows con el nuevo sistema Windows Subsystem for Linux (WSL). Y puede ser desesperante manipular las fotos que obtienes con tu dispositivo móvil con las aplicaciones de edición alojadas en tu sistema operativo basado en Linux.

    El archivo .heif no tiene programas conocidos asociados


    La nueva versión de gThumb 3.12 incluye la capacidad de carga de archivos con la extensión .jxl .avif, .heif Incluido el formato creado por Apple .heic.

    Pero, por el momento, no reconoce las Live Photos, antes descargar la foto deberemos desactivar la opción Live en nuestro Iphone.


    gThumb es un potente visor, organizador, buscador y administrador de imágenes libre. Fue desarrollado para utilizarse en el entorno de escritorio GNOME. Originalmente estaba basado en el ahora abandonado GQView, y mantiene una interfaz limpia y sencilla. Wikipedia


    gThumb con soporte de imagen HEIF / HEIC, AVIF y JXL

     

    Nos permitirá organizar nuestro álbum de fotos y  realizar ediciones sencillas.

    Si tu sistema está basado en Debian, esta aplicación se encuentra en los repositorios principales. Para instalarlo lo podremos hacer desde el terminal con el comando:

    sudo apt install gthumb

    Esta instalación nuestra distribución ya sea compatible con estos formatos de imágen y podrás editar tus fotos por ejemplo con el programa Gimp

    DOSBox

    En el primer ordenador que llegó a mi casa se encontraba instalado MS-Dos v6.2. No existían ventanas, ni APP, y los teléfonos no eran inteligentes. Las redes sociales eran quedar con los amigos en el parque a jugar a bate, o a las chapas.
    Las opciones eran muy limitadas, mi primer trabajo mecanografiado e imprimido, para el instituto, fue utilizando el comando Edit. Los gráficos de los juegos dependian mucho de nuestra imaginación para que la definición de las imágenes fueran en alta definición.
    Si aún conservas programas y juegos de aquella época, te resultará complicado hacer funcionar esas pequeñas joyas con los sistemas operativos actuales.
    DOSBox es un emulador multiplataforma en cual corre el sistema operativo MS-Dos v5.0 .

    DOSBox


    Con ayuda de esta pequeña herramienta podremos lanzar nuestras aplicaciones y juegos del siglo pasado. Si eres un nostálgico, pero no guardas copia de estas aplicaciones, hay páginas que han recopilado estos clasicos:


    En esta última página podremos jugar en el navegador utilizando un emulador de DOSBox.

    Desde la página de descarga, podremos bajarnos la versión adecuada a nuestro sistema operativo y la traducción del mismo al español.

    Pagina descarga DOSBox

    Una vez que instalemos DOSBox, localizamos en que directorio se encuentra el archivo

    dosbox-0.74.conf
    y descomprimimos el archivo de traducción en el directorio donde se encuentre la configuración de nuestro emulador, sustituyendo. En mi caso, que utilizo Linux Mint se encuentra en un directorio oculto en la capeta del usuario:

    /home/mi_usuario/.dosbox

    Podremos ejecutar los comandos básicos que recordamos de DOS. Pero se echa mucho de menos el comando Edit. Y más concretamente cuando queremos automatizar la tarea de montar la carpeta donde guardo mis retro juegos. DOSBox se encuentra encapsulado en una unidad llamada Z: y no tiene acceso a los directorios de nuestro sistema operativo. Para mostrarle estás ubicaciones es necesario montar un directorio con el que tengamos que trabajar. Montar unidades no es más común para aquellos usuarios que utilicen Linux.

    mount c ~/dosgames

    En Windows:

    mount c c:\dosgames

    Una observación, el teclado, y el mapa de caracteres cargado en un sistema no compatible con los teclados castellanos.

    Los dos puntos : se encuentra en eñe mayúscula Ñ.

    Distribución teclado DOSBox

    Para cambiar al teclado español:

    keyb la
    Accedemos a la unidad que hemos creado, en este caso c.

    c:

    UFO Enemigo desconocido

    UFO Enemigo desconocido


    Para montar automáticamente la carpeta donde guardamos nuestras aplicaciones que utilizaremos con DOSBox, colaremos nuestro comando en el famosos archivo de procesamiento por lotes autoexec.bat. Como hemos dicho, no disponemos del editor de texto Edit dentro de nuestro emulador. Desde nuestro sistema operativo, editaremos el archivo dosbox-0.74.conf . En la parte final del mismo:

    [autoexec]
    # Las líneas en esta sección serán ejecutadas al inicio.
    # Puede poner sus líneas MOUNT acá.
    keyb la
    mount c ~/dosgames

    c:

    Como es un archivo de procesamiento por lotes, aquellos comando que incluimos en este apartado se cargaran al arranque de nuestro DOS emulado.

    • Cambiamos la disposición del teclado al español
    • Montamos la carpeta que queremos utilizar 
    • Nos posicionarnos en la unidad que hemos montado.

    Webmin, salvavidas para los que no somos puritanos de la linea de comandos

    No me considero puritano de la línea de comandos, incluso es desesperante 😣😱.
    Si que es cierto que para la gestión de nuestro equipo, servidor local o remoto es una herramienta imprescindible; y nos permite un consumo mínimo de recursos.
    Pero la carne es debil. Webmin es una herramienta para la gestión sistemas Unix, como GNU/Linux y OpenSolaris basado en web; si podremos utilizar el ratón 😈. Está escrito en Perl, se encuentra en español y como he dicho es vía web, con lo cual es multiplataforma.

    Wiki Webmin


    En la siguiente página se encuentra los distintos formatos de empaquetado para poder instalarlo en nuestro equipo
    http://www.webmin.com/download.html
    wegt  https://prdownloads.sourceforge.net/webadmin/webmin_1.900_all.deb
    sudo dpkg -i webmin_1.900_all.deb
    En mi caso la instalación en una Raspberry con el sistema operativo Raspbian no hubo ningún problema. Pero en Linux Mint 19.1 Cinnamon no resulto tan fácil y tuve que resolver dependencias con un paquete que faltaba.

    Una vez instalado, accederemos desde nuestro navegador a la dirección ip que queremos administrar a través de protocolo seguro https y el puerto 10.000:

    https://localhost:10000/

    Puede ser que tu navegador te recuerde que la conexión no es privada, continuamos de todos modos.


    Y solo nos quedará iniciar sesión como root o como el usuario que tengamos como administrador

    Cancelar todos los trabajos de la cola de impresión

    Lance por error un trabajo a una de las impresoras que tengo. Cada vez que encendía el ordenador me notificaba que el trabajo no había sido realizado pero no encontraba la aplicación gráfica para acceder a la cola de impresión para cancelar el trabajo en Linux Mint.
    Buscando, descubrí el comando
    cancel
    NAME
           cancel - cancel jobs

    SYNOPSIS
           cancel  [ -E ] [ -U username ] [ -a ] [ -h hostname[:port] ] [ -u user‐
           name ] [ -x ] [ id ] [ destination ] [ destination-id ]

    DESCRIPTION
           The cancel command cancels print jobs.  If  no  destination  or  id  is
           specified,  the  currently  printing  job on the default destination is
           canceled.

    OPTIONS
           The following options are recognized by cancel:

           -a   Cancel all jobs on the named destination, or all jobs on all  des‐
                tinations if none is provided.
    Y con la opción -a cancelo todos los trabajos pendientes
    cancel -a