مقالات

به طور خودکار متن را برای کتیبه تصویر با استفاده از Google Cloud Vision API با JavaScript و Node.js ایجاد کنید


اتوماسیون کتیبه تصویر برای چندین برنامه ، از بهبود دسترسی و سئو تا بهینه سازی مدیریت محتوا بسیار ارزشمند است. فن آوری های مدرن هوش مصنوعی تولید خودکار تصاویر را بسیار ساده تر و آسان تر کرده اند. این مقاله به شما نحوه استفاده از API در Google Cloud Vision برای تولید خودکار تصاویر ، با کدهای JavaScript و Node.js را ترجمه می کند. ما همچنین به شما نشان می دهیم که چگونه می توانید متن ALT را با استفاده از Ayrshare API تولید کنید.

پیش نیازهای

  • درک اصلی JavaScript و Node.js
  • ملاقات با API استراحت
  • حساب Google Cloud Platform (GCP)

فن آوری

  1. JavaScript (node.js)
  2. Axios برای درخواست HTTP
  3. json

مراحل تولید خودکار متن در کتیبه های تصویر

مرحله 1: API را در Google Cloud Vision تنظیم کنید

  1. کنسول ابر خود را در Google وارد کنید.
  2. یک پروژه جدید ایجاد کنید یا یک برنامه موجود را انتخاب کنید.
  3. “API & Services” -> “کتابخانه” را باز کنید ، سپس به دنبال “API برای Cloud Vision” باشید و آن را فعال کنید.
  4. برای پروژه خود یک شناسه (کلید API یا کلید فایل JSON) ایجاد کنید.

مرحله 2: بسته های مورد نیاز را نصب کنید

برای ایجاد درخواست های HTTP ، از کتابخانه Axios استفاده خواهیم کرد. اگر در حال حاضر نیستید ، آن را با استفاده از NPM نصب کنید:

npm install axios

مرحله 3: کد را بنویسید

در اینجا نحوه نوشتن یک اسکریپت Node.js برای استفاده از Google Cloud Vision API برای تولید زیرنویس آورده شده است:

const axios = require('axios');
const fs = require('fs');

// Initialize API endpoint and API key
const API_ENDPOINT = "https://vision.googleapis.com/v1/images:annotate";
const API_KEY = "";

// Define headers for the API request
const headers = {
  'Content-Type': 'application/json'
};

// Base64 encode your image
const image = fs.readFileSync('path/to/your/image.jpg', { encoding: 'base64' });

// Prepare the payload
const payload = JSON.stringify({
  requests: [
    {
      image: {
        content: image
      },
      features: [
        {
          type: "LABEL_DETECTION",
          maxResults: 1
        }
      ]
    }
  ]
});

// Make the API request
axios.post(`${API_ENDPOINT}?key=${API_KEY}`, payload, { headers })
  .then(response => {
    const result = response.data;

    // Extract the caption (label)
    if (result.responses && result.responses[0].labelAnnotations) {
      const caption = result.responses[0].labelAnnotations[0].description;
      console.log(`Generated caption: ${caption}`);
    } else {
      console.log("Caption not generated.");
    }
  })
  .catch(error => {
    console.error("An error occurred:", error);
  });

تعویض کردن با کلید API که از کنسول Google Cloud دریافت کرده اید. روش را به پرونده تصویر تغییر دهید.

مرحله 4: کد را تکمیل کنید

فیلمنامه خود را ذخیره کرده و آن را اجرا کنید. اگر همه چیز به درستی تنظیم شده است ، باید کتیبه تولید شده برای تصویر خود را مشاهده کنید.

درک هزینه های API Google Cloud Vision API

قبل از معرفی برخی از سرویس های ابری در برنامه خود ، درک عواقب هزینه آن بسیار مهم است. Google Cloud Vision API نیز از این قاعده مستثنی نیست. اگرچه API سطح آزاد را ارائه می دهد ، هزینه ها می توانند با استفاده از آن مقیاس بگیرند و هنگام برنامه ریزی معماری برنامه شما ، در نظر گرفتن آن ضروری است.

سطح آزاد

Google Cloud Vision API یک سطح رایگان ارائه می دهد ، که شامل:

  • 1000 واحد عملکرد در هر ماه برای 12 ماه اول
  • 1000 واحد در ماه برای عملکرد تشخیص API برای بینایی ابر

برای به روزترین اطلاعات در مورد محدودیت های سطح رایگان ، صفحه قیمت گذاری Google Cloud را بررسی کنید.

لایه پرداخت شده

هنگامی که از محدودیت های استفاده از سطح آزاد فراتر رفتید ، به سطح پرداخت شده منتقل می شوید و انواع مختلفی از ویژگی های تشخیص تصویر با هزینه های مختلف ارائه می شود. قیمت گذاری معمولاً در دو دسته قرار می گیرد:

  1. قیمت گذاری بر اساس توابع: قیمت بستگی به ویژگی خاصی که استفاده می کنید ، مانند تشخیص برچسب ، پیدا کردن افراد و غیره بستگی دارد.
  2. قیمت گذاری مبتنی بر حجم: هرچه بیشتر استفاده کنید ، ارزان تر می شود. Google قیمت های کمتری را برای حجم درخواست API بزرگتر ارائه می دهد.

دلایل هزینه

در اینجا برخی از عوامل باید در نظر داشته باشید:

  • شماره: اگر از چندین ویژگی مانند تشخیص برچسب ها و تشخیص چهره در همان تصویر استفاده می کنید ، هزینه ها بر اساس تعداد توابع مورد استفاده ضرب می شوند.
  • محدودیت سرعت: اطمینان حاصل کنید که محدودیت سرعت را فشار ندهید زیرا این ممکن است عملکرد برنامه شما را مختل کند.
  • درخواست های دسته ای: Google Cloud Vision API به شما امکان می دهد درخواست های دسته ای را تهیه کنید که می تواند سودآورتر و مؤثرتر باشد.
  • هزینه انتقال داده ها: اگرچه به طور کلی حداقل ، ممکن است هزینه های انتقال داده های اضافی نیز وجود داشته باشد ، به خصوص اگر شما در حال انتقال حجم زیادی از داده ها به خارج از Google Cloud هستید.

برای جلوگیری از هزینه های غیر منتظره ، سیگنال های بودجه را در کنسول Google Cloud خود تنظیم کنید ، بنابراین وقتی هزینه های شما به آستانه خاصی رسید ، به شما اطلاع داده می شود.

مراحل با استفاده از Ayrshare API

جایگزین تر استفاده از Ayrshare API است. با Max Pack بسیاری از برنامه های مفید ، از جمله ژنراتور متن ALT را دریافت می کنید.

مرحله 1: یک حساب در Ayrshare تنظیم کنید

  1. برای Ayrshare ثبت نام کنید و Max Pack را به حساب خود اضافه کنید.
  2. کلید API خود را در داشبورد Ayrshare دریافت کنید.

مرحله 2: کد را بنویسید

در اینجا کد تماس نمونه API در node.js. آورده شده است.

const API_KEY = "API_KEY";
fetch("https://api.ayrshare.com/api/generate/altText", {
      method: "POST",
      headers: {
        "Content-Type": "application/json",
        "Authorization": `Bearer ${API_KEY}`
      },
      body: JSON.stringify({
        url: "https://img.ayrshare.com/012/gb.jpg", // required
      }),
    })
      .then((res) => res.json())
      .then((json) => console.log(json))
      .catch(console.error);

اطمینان حاصل کنید که {api_key} را با کلید API از داشبورد و URL با URL تصویر خود تغییر دهید.

مرحله 3: کد را تکمیل کنید

آن را ذخیره کرده و آن را شروع کنید. اکنون پاسخ با متن Alt تولید شده ، مشابه نمونه زیر را مشاهده خواهید کرد.

{
    "status": "success",
    "altText": "A ghostbusters vehicle driving through a field.",
    "url": "https://img.ayrshare.com/012/gb.jpg"
}

متن alt را از دست ندهید

به طور خودکار تولید کتیبه های تصویر دارای برنامه های مختلفی از جمله بهبود دسترسی به وب سایت ، SEO و تشخیص محتوا است. با استفاده از ابزارهای مدرن AI ، به راحتی می توان این فرآیند را به نفع کاربران و تجارت خود خودکار کرد.


Source link

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا