Contexte

Le package openxlsx est actuellement la solution la plus élégante pour travailler directement sur des fichiers au format XLSX dans R. Son principal avantage face aux autres solutions (xlsx ou XLConnect) est de s'affranchir des dépendances Java.

Ce billet traitera de l'installation de ce package, en particulier sous Windows.

Installation

L'installation du package peut se faire de manière traditionnelle dans R avec :

install.packages("openxlsx")

Pour Windows

Pour Windows, une étape supplémentaire est nécessaire : l'installation des RTools. Pour se faire il suffit de :

  1. Télécharger la bonne version des RTools sur la page du CRAN.
  2. Lancer l'installateur (et donc avoir les droits administrateur sur sa machine)
  3. Si l'installation semble problématique, voir ce tutoriel.

Autre possiblité, directement dans R :

installr::install.rtools()

Pourquoi cette étape supplémentaire? Car openxlsx a besoin d'un logiciel pour dézipper les fichiers XLSX, qui sont en effet que des archives ZIP contenants plusieurs fichiers XML. Ce logiciel est déjà installé par défaut sur MacOS et Linux, mais pas sous Windows.

Conclusion

Le format XLSX est largement répandu dans le monde du travail. C'est un progrès par rapport au format XLS mais ce format pose encore de nombreux problèmes. Cependant dans R c'est acutellement le format de fichier de tableur qui me semble le mieux géré. Il serait bon qu'il existe un package équivalent pour les fichiers ODS. Des projets sont en cours mais rien de convaincant pour l'instant.