EN FR
Login

Inktopia

Color analysis of fountain pen inks

Frequently Asked Questions

Color analysis of fountain pen inks

Color extraction from images

Color extraction relies on the K-means algorithm, a clustering method that groups pixels by similarity. Before analyzing the image, the system automatically filters background pixels: white or ivory paper, gray shadows, grids and light blue lines. This detection examines each pixel's brightness and saturation to exclude anything that isn't ink (very light pixels, quasi-achromatic, or with very similar RGB values indicating gray). Once cleaned, the image is analyzed by K-means which identifies the 5 most significant ink color clusters. For each cluster, the system calculates the average color and its percentage. These colors are then stored in three different color spaces (RGB, HSV, LAB) because each captures distinct aspects: RGB for screen display, HSV to separate hue and saturation, LAB for human perception. This triple representation enables robust comparisons between inks, regardless of lighting variations or image quality.

Average and dominant color calculation

Each ink typically has multiple photos taken under different conditions. The system first analyzes each photo individually with K-means to extract its 5 main colors and their proportions. These results are then combined by weighting each color by its importance (percentage of pixels it represents). The final average color corresponds to the weighted average of all colors extracted from all photos. This multi-photo approach compensates for single-image biases: an overly dark or saturated photo has less impact if other photos balance it out. The result is a more faithful representation of the ink's true color.

Ink complexity measurement

Complexity measures the number of distinct colors and their dispersion. A simple, uniform ink (like a pure blue) scores close to 0. An ink with light shading scores 0.1-0.3. An ink with strong shading or two-tone effects scores 0.4-0.6. Truly multi-chromatic inks with sheen or shimmer reach 0.7+.

Analysis quality measurement

Analysis quality indicates how reliable the ink's color analysis is. It's calculated from four factors: number of images (30%), outlier proportion (30%), average image quality (30%), and whether a similarity vector exists (10%). A score of 0.9+ means excellent quality (10+ images, no outliers). 0.7-0.9 is very reliable (6+ images). 0.5-0.7 is good (3-5 images). 0.3-0.5 is fair but improvable (1-2 images). Below 0.3 means the analysis needs more images to be trustworthy. This score helps identify which inks need additional photos for better accuracy.

Poor quality image detection

The system automatically detects outlier images using Z-score on color deviation. If the absolute Z-score exceeds 2, the image is flagged as an outlier with the specific reason (e.g., "Color deviation Z-score: 3.45"). These markers identify shooting problems: overly strong flash, incorrect white balance, or partially dried ink. The admin interface allows viewing these flagged images and excluding them from analysis if they distort the ink's representation.

Ink similarity calculation

Each ink is represented by a 128-dimensional vector encoding its colorimetric characteristics. The average color occupies 45 dimensions (30 in repeated HSV, 15 in repeated RGB) or 35% of the total, ensuring it remains the dominant factor. The top 3 dominant colors and their proportions occupy 12 dimensions. A hue distribution histogram (18 bins of 20°) captures the overall distribution. Statistical moments (standard deviation, skewness, kurtosis) on H, S, and V reveal the ink's internal variability. Perceptual features (luminosity, chromaticity, purity) add a visual dimension. Finally, complexity metrics (entropy, dominant color weight) and the encoded color category complete the vector. Similarity between two inks is calculated using cosine distance: the closer to 1, the more similar the inks. This multi-dimensional representation captures both the main hue and secondary nuances, enabling identification of visually similar inks even if their exact composition differs.

Why do some similar inks look different?

Calculated similarity is mathematical and objective, but color perception is subjective and contextual. The screen used to view inks plays a major role: a poorly calibrated display can shift hues or saturation. Ambient lighting also modifies perception: warm light makes blues appear grayer, cold light diminishes reds. Individual differences in color perception (partial color blindness, variable sensitivity to nuances) also influence judgment. Finally, the paper and pen used to create the photographed swatch affect rendering: absorbent paper will dull the ink, glossy paper will enhance sheen. The algorithm strongly weights the average color (35% of the vector): two inks with similar base tones but different undertones may score highly, even if visually one appears greener and the other bluer. Mathematical similarity does not replace the human eye, it complements it.

Chromaticity diagram representation

The chromaticity diagram is a polar plot where each ink is positioned according to two axes: the angle represents hue (0° for red, 120° for green, 240° for blue), and the distance from center represents chroma (saturation × brightness). This representation separates the hue dimension from the intensity dimension: a vivid red ink and a pale red ink will have the same angle but different distances. Gray inks, with low saturation, cluster at the center. Highly saturated and bright inks move toward the periphery. This visualization facilitates catalog exploration: to find blues, look toward 240°; for intense colors, move away from the center. Visible clusters reveal available color families and underrepresented areas.

Questions fréquentes

Analyse des couleurs d'encres pour stylos plume

Extraction des couleurs dans les images

L'extraction des couleurs repose sur l'algorithme K-means, une méthode de clustering qui regroupe les pixels par similarité. Avant d'analyser l'image, le système filtre automatiquement les pixels de fond : papier blanc ou ivoire, ombres grises, quadrillages et lignes bleues claires. Cette détection examine la luminosité et la saturation de chaque pixel pour exclure tout ce qui n'est pas de l'encre (pixels très clairs, quasi-achromatiques, ou avec RGB très proches indiquant du gris). Une fois nettoyée, l'image est analysée par K-means qui identifie les 5 groupes de couleurs d'encre les plus importants. Pour chaque groupe, le système calcule la couleur moyenne et son pourcentage. Ces couleurs sont ensuite stockées dans trois espaces colorimétriques différents (RGB, HSV, LAB) car chacun capture des aspects distincts : RGB pour l'affichage écran, HSV pour séparer teinte et saturation, LAB pour la perception humaine. Cette triple représentation permet des comparaisons robustes entre encres, indépendamment des variations d'éclairage ou de qualité d'image.

Calcul des couleurs moyennes et dominantes

Chaque encre dispose généralement de plusieurs photos prises dans des conditions différentes. Le système analyse d'abord chaque photo individuellement avec K-means pour extraire ses 5 couleurs principales et leurs proportions. Ces résultats sont ensuite combinés en pondérant chaque couleur par son importance (pourcentage de pixels qu'elle représente). La couleur moyenne finale correspond à la moyenne pondérée de toutes les couleurs extraites de toutes les photos. Cette approche multi-photos compense les biais d'une seule image : une photo trop sombre ou trop saturée aura moins d'impact si d'autres photos équilibrent. Le résultat est une représentation plus fidèle de la vraie couleur de l'encre.

Mesure de la complexité d'une encre

La complexité mesure le nombre de couleurs distinctes et leur dispersion. Une encre simple et uniforme (comme un bleu pur) obtient un score proche de 0. Une encre avec du shading léger obtient 0.1-0.3. Une encre avec un fort shading ou des effets bi-tons obtient 0.4-0.6. Les encres véritablement multi-chromatiques avec sheen ou shimmer atteignent 0.7+.

Mesure de la qualité de l'analyse

La qualité de l'analyse indique la fiabilité de l'analyse colorimétrique d'une encre. Elle est calculée à partir de quatre facteurs : nombre d'images (30%), proportion d'outliers (30%), qualité moyenne des images (30%), et présence d'un vecteur de similarité (10%). Un score de 0.9+ signifie excellente qualité (10+ images, pas d'outliers). 0.7-0.9 est très fiable (6+ images). 0.5-0.7 est bon (3-5 images). 0.3-0.5 est acceptable mais améliorable (1-2 images). En dessous de 0.3, l'analyse nécessite plus d'images pour être fiable. Ce score aide à identifier les encres nécessitant des photos supplémentaires pour une meilleure précision.

Détection des images de mauvaise qualité

Le système détecte automatiquement les images aberrantes (outliers) en utilisant un Z-score sur la déviation de couleur. Si le Z-score absolu dépasse 2, l'image est marquée comme outlier avec la raison spécifique (ex: "Color deviation Z-score: 3.45"). Ces marqueurs identifient les problèmes de prise de vue : flash trop fort, balance des blancs incorrecte, ou encre partiellement sèche. L'interface d'administration permet de visualiser ces images marquées et de les exclure de l'analyse si elles faussent la représentation de l'encre.

Calcul de la similarité entre encres

Chaque encre est représentée par un vecteur de 128 dimensions qui encode ses caractéristiques colorimétriques. La couleur moyenne occupe 45 dimensions (30 en HSV répété, 15 en RGB répété) soit 35% du total, garantissant qu'elle reste le facteur dominant. Les 3 couleurs dominantes et leurs proportions occupent 12 dimensions. Un histogramme de distribution des teintes (18 intervalles de 20°) capture la répartition globale. Les moments statistiques (écart-type, asymétrie, kurtosis) sur H, S et V révèlent la variabilité interne de l'encre. Les caractéristiques perceptuelles (luminosité, chromaticité, pureté) ajoutent une dimension visuelle. Enfin, des métriques de complexité (entropie, poids de la couleur dominante) et la catégorie de couleur encodée complètent le vecteur. La similarité entre deux encres se calcule avec la distance cosinus : plus elle est proche de 1, plus les encres sont similaires. Cette représentation multi-dimensionnelle capture à la fois la teinte principale et les nuances secondaires, permettant d'identifier des encres visuellement proches même si leur composition exacte diffère.

Pourquoi certaines encres similaires semblent-elles différentes ?

La similarité calculée est mathématique et objective, mais la perception des couleurs est subjective et contextuelle. L'écran utilisé pour visualiser les encres joue un rôle majeur : un écran mal calibré peut décaler les teintes ou la saturation. L'éclairage ambiant modifie également la perception : une lumière chaude rendra les bleus plus gris, une lumière froide atténuera les rouges. Les différences individuelles de perception des couleurs (daltonisme partiel, sensibilité variable aux nuances) influencent aussi le jugement. Enfin, le papier et le stylo utilisés pour créer le nuancier photographié affectent le rendu : un papier absorbant ternira l'encre, un papier glacé accentuera le sheen. L'algorithme, lui, pondère fortement la couleur moyenne (35% du vecteur) : deux encres avec des tons de base similaires mais des sous-tons différents peuvent obtenir un score élevé, même si visuellement l'une paraît plus verte et l'autre plus bleue. La similarité mathématique ne remplace pas l'œil humain, elle le complète.

Représentation du diagramme de chromaticité

Le diagramme de chromaticité est un graphique polaire où chaque encre est positionnée selon deux axes : l'angle représente la teinte (0° pour le rouge, 120° pour le vert, 240° pour le bleu), et la distance du centre représente le chroma (saturation × luminosité). Cette représentation sépare la dimension de teinte de la dimension d'intensité : une encre rouge vif et une encre rouge pâle auront le même angle mais des distances différentes. Les encres grises, peu saturées, se regroupent au centre. Les encres très saturées et lumineuses s'éloignent vers la périphérie. Cette visualisation facilite l'exploration du catalogue : pour trouver des bleus, on regarde vers 240° ; pour des couleurs intenses, on s'éloigne du centre. Les clusters visibles révèlent les familles de couleurs disponibles et les zones sous-représentées.