Show Menu
SUJETS×

Présence de texte et reconnaissance de caractères optiques

Content and Commerce AI est en version bêta. La documentation peut être modifiée.
Le service Visibilité de texte / Reconnaissance optique de caractères (OCR), lorsqu’une image est donnée, peut indiquer si du texte est présent dans l’image. Si du texte est présent, la reconnaissance optique des caractères peut renvoyer le texte.
L'image suivante a été utilisée dans l'exemple de demande illustré dans ce document :
Format d’API
POST /services/v1/predict

Requête
La requête suivante vérifie si du texte est présent en fonction de l’image d’entrée fournie dans la charge utile. Consultez le tableau ci-dessous pour plus d’informations sur les paramètres d’entrée affichés.
analyzer_id détermine lequel Sensei Content Framework est utilisé. Veuillez vérifier que vous en avez le bon analyzer_id avant de faire votre demande. Contactez l’équipe bêta de Content and Commerce AI pour recevoir votre analyzer_id demande pour ce service.
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v1/predict \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "Content-Type: multipart/form-data" \
  -H "cache-control: no-cache,no-cache" \
  -H "x-api-key: {API_KEY}" \
  -F file=@TestImage.jpg \
  -F 'contentAnalyzerRequests={
    "enable_diagnostics":"true",
    "requests":[{
    "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
    "parameters": {
      "application-id": "1234",
      "content-type": "inline",
      "encoding": "jpeg",
      "threshold": "0",
      "top-N": "0",
      "custom": {},
      "data": [{
        "content-id": "0987",
        "content": "inline-image",
        "content-type": "inline",
        "encoding": "jpeg",
        "threshold": "0",
        "top-N": "0",
        "historic-metadata": [],
        "custom": {}
        }]
      }
    }]
  }'

Propriété
Description
Obligatoire
analyzer_id
ID Sensei de service sous lequel votre demande est déployée. Cet identifiant détermine lequel des Sensei Content Frameworks est utilisé. Pour les services personnalisés, contactez l’équipe d’API Content and Commerce pour configurer un identifiant personnalisé.
Oui
application-id
ID de l’application créée.
Oui
data
Tableau contenant un objet JSON avec chaque objet du tableau représentant une image transmise. Tous les paramètres transmis dans le cadre de ce tableau remplacent les paramètres globaux spécifiés en dehors du data tableau. Toutes les autres propriétés décrites ci-dessous dans ce tableau peuvent être remplacées de l’intérieur data .
Oui
language
Langue du texte de saisie. La valeur par défaut est en .
Non
content-type
Permet d’indiquer si l’entrée fait partie du corps de la requête ou si une URL signée est associée à un compartiment S3. La valeur par défaut de cette propriété est inline .
Non
encoding
Format de fichier de l’image d’entrée. Actuellement, seules les images JPEG et PNG peuvent être traitées. La valeur par défaut de cette propriété est jpeg .
Non
threshold
Seuil de score (0 à 1) au-dessus duquel les résultats doivent être renvoyés. Utilisez la valeur 0 pour renvoyer tous les résultats. La valeur par défaut de cette propriété est 0 .
Non
top-N
Nombre de résultats à renvoyer (ne peut pas être un entier négatif). Utilisez la valeur 0 pour renvoyer tous les résultats. Lorsqu'elle est utilisée conjointement avec threshold , le nombre de résultats renvoyés est le moins élevé des deux limites définies. La valeur par défaut de cette propriété est 0 .
Non
custom
Tout paramètre personnalisé à transmettre. Cette propriété requiert un objet JSON valide pour fonctionner.
Non
content-id
ID unique de l’élément de données renvoyé dans la réponse. Si elle n’est pas transmise, un identifiant généré automatiquement est attribué.
Non
content
Le contenu peut être une image brute (type de contenu "intégré").
Si le contenu est un fichier sur S3 (type de contenu du compartiment 3), transmettez l’URL signée.
Oui
Réponse
Une réponse réussie renvoie le texte qui a été détecté dans le feature_value tableau. Le texte est lu et renvoyé de gauche à droite de haut en bas. Cela signifie que si "J’aime l’Adobe" a été détecté, votre charge utile renvoie "I", "love" et "Adobe" dans des objets distincts. Dans l’objet, vous recevez un feature_name qui contient le mot et un feature_value qui contient une mesure de confiance pour ce texte.
{
  "status": 200,
  "content_id": "TestImage.jpg",
  "cas_responses": [
    {
      "status": 200,
      "analyzer_id": "Feature:image-text-extractor-ocr:Service-b0675160421e404ca3c7ca60f46a5b29",
      "content_id": "TestImage.jpg",
      "result": {
        "response_type": "feature",
        "response": [
          {
            "feature_value": [
              {
                "feature_value": "yes",
                "feature_name": "has_text"
              },
              {
                "feature_value": "0.977",
                "feature_name": "CHEF"
              },
              {
                "feature_value": "success",
                "feature_name": "text_processing_status"
              }
            ],
            "feature_name": "ocr"
          }
        ]
      }
    }
  ],
  "error": []
}