Visionneuse Apache Parquet Gratuite – Ouvrez et Explorez vos fichiers Parquet

Visualisez et explorez des fichiers Apache Parquet directement dans votre navigateur. Inspectez les schémas, les métadonnées et les structures de données colonnaires pour vos flux ETL, ou convertissez vos fichiers Parquet en JSON, CSV, TSV ou XLSX.

Upload Parquet File

Select a Parquet file to analyze and query. Maximum file size: 100MB

Drop your Parquet file here

or click to browse

Supported formats: .parquet, .parq
Max size: 100 MB

4.5

Ready to View Your Parquet Files?

Join thousands of developers who trust our OJF for their daily workflow. Fast, reliable, and completely free.

100% Free
No Registration
Privacy Protected

Visionneuse Parquet en ligne pour Développeurs et Data Engineers

Ouvrez et inspectez des fichiers Apache Parquet en ligne. Analysez les schémas colonnaires, examinez les métadonnées, explorez les enregistrements et exportez des sous-ensembles en JSON ou CSV pour le débogage et la validation.

Comment lire des fichiers Parquet en Python

Lire des fichiers Parquet avec Pandas

python

Pandas est la bibliothèque la plus courante pour la manipulation de données en Python et propose une fonction read_parquet très simple.

# Installation: pip install pandas
import pandas as pd

df = pd.read_parquet('path/to/file.parquet')
print(df.head())

Lire des fichiers Parquet avec DuckDB

python

DuckDB est un système de gestion de base de données SQL OLAP intégré capable d'interroger directement les fichiers Parquet.

# Installation: pip install duckdb
import duckdb

# Query directly from the file
result = duckdb.sql("SELECT * FROM 'path/to/file.parquet' LIMIT 10").fetchdf()
print(result)

Lire des fichiers Parquet avec ClickHouse

python

ClickHouse est un système de gestion de base de données OLAP open-source ultra-rapide avec un support natif du format Parquet.

# Installation: pip install clickhouse-connect
import clickhouse_connect

client = clickhouse_connect.get_client(host='localhost', port=8123)
query = "SELECT * FROM file('path/to/file.parquet') LIMIT 10"
result = client.query(query).result_set
print(result)

Comment lire des fichiers Parquet dans d'autres langages

Lire du Parquet avec Node.js

javascript

Utilisation de la bibliothèque parquetjs pour lire des fichiers Parquet dans un environnement JavaScript.

// Installation: npm install parquetjs
const parquet = require('parquetjs');

async function readParquet() {
    let reader = await parquet.ParquetReader.openFile('example.parquet');
    let cursor = reader.getCursor();
    let record = null;
    while (record = await cursor.next()) {
        console.log(record);
    }
    await reader.close();
}

Lire du Parquet avec Java

java

Utilisation d'Apache Parquet avec Avro pour un accès aux données au niveau enregistrement en Java.

// Required dependencies: parquet-avro, parquet-hadoop
import org.apache.hadoop.fs.Path;
import org.apache.parquet.hadoop.ParquetReader;
import org.apache.parquet.avro.AvroParquetReader;
import org.apache.avro.generic.GenericRecord;

Path path = new Path("example.parquet");
try (ParquetReader<GenericRecord> reader = AvroParquetReader.<GenericRecord>builder(path).build()) {
    GenericRecord record;
    while ((record = reader.read()) != null) {
        System.out.println(record);
    }
}

Key Features of OJF

Take control of your data - everything in one place

Inspection des Schémas et Métadonnées

  • Inspectez les schémas hiérarchiques Parquet incluant les champs imbriqués et les types de données logiques
  • Examinez les métadonnées au niveau des colonnes comme la nullabilité, l'encodage et les formats de compression
  • Analysez les groupes de lignes (row groups) pour comprendre le partitionnement et la disposition des données
  • Consultez les statistiques de fichier utilisées pour les charges de travail analytiques et les data lakes

Exploration des Données

  • Parcourez les enregistrements Parquet via une vue tabulaire structurée pour une analyse claire
  • Appliquez un filtrage par colonne avec des contrôles intégrés ou des expressions de type SQL
  • Triez les données avec un tri intelligent par type de donnée pour une précision optimale
  • Convertissez les valeurs de temps (epoch) en formats de date et d'heure lisibles
  • Analyse statistique des colonnes incluant les valeurs min/max et le décompte des valeurs nulles

Conversion et Exportation

  • Convertissez les fichiers Parquet au format JSON pour les API et les workflows d'applications
  • Exportez les datasets en CSV ou TSV pour vos rapports et analyses sur tableur
  • Téléchargez les données au format XLSX pour une compatibilité totale avec Excel
  • Extrayez des sous-ensembles filtrés pour la validation et le traitement en aval
  • Téléchargement de données filtrées basées sur vos propres critères de sélection

Comment visualiser des fichiers Parquet en ligne

1

Téléchargez un fichier Parquet (.parquet) via le sélecteur de fichiers

2

Examinez le schéma pour comprendre les colonnes, les types de données et l'imbrication

3

Inspectez les métadonnées telles que la compression, l'encodage et les groupes de lignes

4

Parcourez les enregistrements dans la vue tabulaire pour la validation ou le débogage

5

Appliquez des filtres ou une recherche pour cibler des données spécifiques

6

Exportez les données sélectionnées en JSON ou CSV si nécessaire

Why Choose Us?

Feature
Online JSON Formatt(OJF)
Other Tools
Visibilité du schémaSchéma hiérarchique avec contexte de métadonnéesAffichage de schéma plat ou limité
Traitement par navigateurInspection locale côté client (confidentialité assurée)Téléchargement requis sur un serveur
Flexibilité d'exportationExport JSON, CSV et ExcelOptions d'exportation restreintes ou inexistantes

Frequently Asked Questions