Show Menu
화제×

키워드 추출

Content and Commerce AI 가 베타 버전입니다. 설명서는 변경될 수 있습니다.
키워드 추출 서비스는 텍스트 문서에서 문서의 제목을 가장 잘 설명하는 키워드 또는 키구문을 자동으로 추출합니다. 키워드를 추출하기 위해 NER(명명된 엔티티 인식) 및 비감독 키워드 추출 알고리즘의 조합이 사용됩니다.
다음 표에 이름이 지정된 엔티티 Content and Commerce AI 가 나열됩니다.
엔티티 이름
설명
PERSON
허구까지
NORP
국적 또는 종교나 정치집단.
GPE
국가, 도시 및 주
LOC
비GPE 위치, 산간, 물의 신체.
FAC
건물, 공항, 고속도로, 다리 등
ORG
회사, 기관, 기관 등
제품
물체, 차량, 식품 등 (서비스 아님)
EVENT
이름이 허리케인, 전투, 전쟁, 스포츠 행사 등입니다.
WORK_OF_ART
책, 노래 등의 제목
법률
법률로 지정된 문서
언어
지정된 언어
API 형식
POST /services/v1/predict

요청
다음 요청은 페이로드에 제공된 입력 매개 변수를 기반으로 문서에서 키워드를 추출합니다.
입력 파일의 간소화된 JSON:
{
  "application-id": "1234",
  "language": "en",
  "content-type": "inline",
  "encoding": "utf-8",
  "threshold": 0.01,
  "top-N": 10,
  "custom": {
    "min-n": 2,
    "entity-types": ["PERSON"]
  },
  "data": [
    {
      "content-id": "abc123",
      "content": "But an influential faction on the ATP player council, which is chaired by Novak Djokovic, staged a rebellion against Kermodes regime in the spring, and he will leave the post on Dec 31"
    }
  ]
}

표시된 입력 매개 변수에 대한 자세한 내용은 예제 페이로드 아래 표를 참조하십시오.
analyzer_id 사용할 항목 Sensei Content Framework 을 결정합니다. 요청하기 analyzer_id 전에 적절한 것이 있는지 확인하십시오. 키워드 추출 서비스의 경우 analyzer_id ID는 다음과 같습니다. Feature:cintel-ner:Service-1a35aefb0f0f4dc0a3b5262370ebc709
curl -w'\n' -i -X POST https://sensei.adobe.io/services/v1/predict \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "Content-Type: multipart/form-data" \
  -H "cache-control: no-cache,no-cache" \
  -H "x-api-key: {API_KEY}" \
  -F file="{
    \"application-id\": \"1234\", 
    \"language\": \"en\", 
    \"content-type\": \"inline\", 
    \"encoding\": \"utf-8\",
    \"threshold\": 0.01,
    \"top-N\": 10,
    \"custom\": {
        \"min-n\": 2,
        \"entity-types\": [\"PERSON\"]
      },
    \"data\": [{
      \"content-id\": \"abc123\", 
      \"content\": \"But an influential faction on the ATP player council, which is chaired by Novak Djokovic, staged a rebellion against Kermodes regime in the spring, and he will leave the post on Dec 31\"
      }]
    }" \
  -F 'contentAnalyzerRequests={
    "enable_diagnostics":"true",
    "requests":[{
         "analyzer_id": "Feature:cintel-ner:Service-1a35aefb0f0f4dc0a3b5262370ebc709",
         "parameters": {}
    }]
}'

속성
설명
필수입니다
analyzer_id
요청이 배포된 Sensei 서비스 ID. 이 ID는 어떤 것이 사용되는지 Sensei Content Frameworks 를 결정합니다. 사용자 지정 서비스의 경우 콘텐츠 및 커머스 AI 팀에 문의하여 사용자 지정 ID를 설정하십시오.
application-id
만든 응용 프로그램의 ID입니다.
data
문서를 나타내는 배열에 각 개체가 있는 JSON 개체가 포함된 배열입니다. 이 배열의 일부로 전달되는 모든 매개 변수는 배열 외부에 지정된 전역 매개 변수를 data 무시합니다. 이 표에 나와 있는 나머지 속성은 내에서 재정의할 수 있습니다 data .
language
입력 텍스트 언어 기본값은 en 입니다.
아니요
content-type
입력이 요청 본체의 일부인지 또는 S3 버킷에 대해 서명된 URL인지 나타내는 데 사용됩니다. 이 속성의 기본값은 입니다 inline .
encoding
입력 텍스트의 인코딩 형식입니다. 이것은 utf-8 또는 utf-16 . 이 속성의 기본값은 입니다 utf-8 .
아니요
threshold
결과를 반환해야 하는 상단의 점수(0-1)입니다. 값을 사용하여 모든 결과 0 를 반환합니다. 이 속성의 기본값은 입니다 0 .
아니요
top-N
반환할 결과 수(음수일 수 없음) 값을 사용하여 모든 결과 0 를 반환합니다. 이와 함께 사용할 경우 반환되는 결과 threshold 의 수가 두 제한 중 더 적습니다. 이 속성의 기본값은 입니다 0 .
아니요
custom
전달할 사용자 지정 매개 변수입니다. 이 속성을 사용하려면 유효한 JSON 개체가 있어야 합니다. 사용자 지정 매개 변수에 대한 자세한 내용은 부록을 참조하십시오.
아니요
content-id
응답에서 반환된 데이터 요소의 고유 ID. 이 값이 전달되지 않으면 자동 생성된 ID가 할당됩니다.
아니요
content
키워드 추출 서비스에서 사용하는 컨텐츠입니다. 컨텐츠는 원시 텍스트('인라인' 컨텐츠 유형)일 수 있습니다.
컨텐츠가 S3('s3-bucket' content-type)에 있는 파일인 경우 서명된 url을 전달합니다. 컨텐츠가 요청 본문에 포함된 경우 데이터 요소 목록에는 하나의 객체만 있어야 합니다. 두 개 이상의 개체가 전달되면 첫 번째 개체만 처리됩니다.
응답
성공적인 응답은 배열에 추출된 키워드가 포함된 JSON 개체를 response 반환합니다.
{
  "status": 200,
  "cas_responses": [
    {
      "status": 200,
      "analyzer_id": "Feature:cintel-ner:Service-1a35aefb0f0f4dc0a3b5262370ebc709",
      "content_id": "",
      "result": {
        "response_type": "feature",
        "response": [
          {
            "feature_value": [
              {
                "feature_value": "success",
                "feature_name": "status"
              },
              {
                "feature_name": "labels",
                "feature_value": [
                  {
                    "feature_name": "atp player",
                    "feature_value": [
                      {
                        "feature_value": "KEYWORD",
                        "feature_name": "type"
                      },
                      {
                        "feature_value": 0.007743432063478832,
                        "feature_name": "score"
                      }
                    ]
                  },
                  {
                    "feature_name": "Novak Djokovic",
                    "feature_value": [
                      {
                        "feature_name": "type",
                        "feature_value": "PERSON"
                      },
                      {
                        "feature_name": "score",
                        "feature_value": 0
                      }
                    ]
                  },
                  {
                    "feature_value": [
                      {
                        "feature_name": "type",
                        "feature_value": "KEYWORD"
                      },
                      {
                        "feature_value": 0.00899321792126428,
                        "feature_name": "score"
                      }
                    ],
                    "feature_name": "player council"
                  },
                  {
                    "feature_value": [
                      {
                        "feature_value": "KEYWORD",
                        "feature_name": "type"
                      },
                      {
                        "feature_value": 0.007743432063478832,
                        "feature_name": "score"
                      }
                    ],
                    "feature_name": "kermodes regime"
                  },
                  {
                    "feature_value": [
                      {
                        "feature_name": "type",
                        "feature_value": "KEYWORD"
                      },
                      {
                        "feature_name": "score",
                        "feature_value": 0.0006052376660884209
                      }
                    ],
                    "feature_name": "atp player council"
                  }
                ]
              }
            ],
            "feature_name": "abc123"
          }
        ]
      }
    }
  ],
  "error": []
}

부록

다음 표에는 사용 가능한 매개 변수가 포함되어 custom 있습니다.
이름
설명
필수입니다
min-n
키워드에 필요한 최소 단어 수입니다.
아니요
entity-types
반환할 엔티티 유형. 이 문서의 시작 부분에 있는 명명된 엔티티 인식 테이블을 참조하십시오.
아니요