به طور خودکار متن را برای کتیبه تصویر با استفاده از Google Cloud Vision API با JavaScript و Node.js ایجاد کنید

اتوماسیون کتیبه تصویر برای چندین برنامه ، از بهبود دسترسی و سئو تا بهینه سازی مدیریت محتوا بسیار ارزشمند است. فن آوری های مدرن هوش مصنوعی تولید خودکار تصاویر را بسیار ساده تر و آسان تر کرده اند. این مقاله به شما نحوه استفاده از API در Google Cloud Vision برای تولید خودکار تصاویر ، با کدهای JavaScript و Node.js را ترجمه می کند. ما همچنین به شما نشان می دهیم که چگونه می توانید متن ALT را با استفاده از Ayrshare API تولید کنید.
پیش نیازهای
- درک اصلی JavaScript و Node.js
- ملاقات با API استراحت
- حساب Google Cloud Platform (GCP)
فن آوری
- JavaScript (node.js)
- Axios برای درخواست HTTP
- json
مراحل تولید خودکار متن در کتیبه های تصویر
مرحله 1: API را در Google Cloud Vision تنظیم کنید
- کنسول ابر خود را در Google وارد کنید.
- یک پروژه جدید ایجاد کنید یا یک برنامه موجود را انتخاب کنید.
- “API & Services” -> “کتابخانه” را باز کنید ، سپس به دنبال “API برای Cloud Vision” باشید و آن را فعال کنید.
- برای پروژه خود یک شناسه (کلید API یا کلید فایل JSON) ایجاد کنید.
مرحله 2: بسته های مورد نیاز را نصب کنید
برای ایجاد درخواست های HTTP ، از کتابخانه Axios استفاده خواهیم کرد. اگر در حال حاضر نیستید ، آن را با استفاده از NPM نصب کنید:
npm install axios
مرحله 3: کد را بنویسید
در اینجا نحوه نوشتن یک اسکریپت Node.js برای استفاده از Google Cloud Vision API برای تولید زیرنویس آورده شده است:
const axios = require('axios');
const fs = require('fs');
// Initialize API endpoint and API key
const API_ENDPOINT = "https://vision.googleapis.com/v1/images:annotate";
const API_KEY = "";
// Define headers for the API request
const headers = {
'Content-Type': 'application/json'
};
// Base64 encode your image
const image = fs.readFileSync('path/to/your/image.jpg', { encoding: 'base64' });
// Prepare the payload
const payload = JSON.stringify({
requests: [
{
image: {
content: image
},
features: [
{
type: "LABEL_DETECTION",
maxResults: 1
}
]
}
]
});
// Make the API request
axios.post(`${API_ENDPOINT}?key=${API_KEY}`, payload, { headers })
.then(response => {
const result = response.data;
// Extract the caption (label)
if (result.responses && result.responses[0].labelAnnotations) {
const caption = result.responses[0].labelAnnotations[0].description;
console.log(`Generated caption: ${caption}`);
} else {
console.log("Caption not generated.");
}
})
.catch(error => {
console.error("An error occurred:", error);
});
تعویض کردن با کلید API که از کنسول Google Cloud دریافت کرده اید. روش را به پرونده تصویر تغییر دهید.
مرحله 4: کد را تکمیل کنید
فیلمنامه خود را ذخیره کرده و آن را اجرا کنید. اگر همه چیز به درستی تنظیم شده است ، باید کتیبه تولید شده برای تصویر خود را مشاهده کنید.
درک هزینه های API Google Cloud Vision API
قبل از معرفی برخی از سرویس های ابری در برنامه خود ، درک عواقب هزینه آن بسیار مهم است. Google Cloud Vision API نیز از این قاعده مستثنی نیست. اگرچه API سطح آزاد را ارائه می دهد ، هزینه ها می توانند با استفاده از آن مقیاس بگیرند و هنگام برنامه ریزی معماری برنامه شما ، در نظر گرفتن آن ضروری است.
سطح آزاد
Google Cloud Vision API یک سطح رایگان ارائه می دهد ، که شامل:
- 1000 واحد عملکرد در هر ماه برای 12 ماه اول
- 1000 واحد در ماه برای عملکرد تشخیص API برای بینایی ابر
برای به روزترین اطلاعات در مورد محدودیت های سطح رایگان ، صفحه قیمت گذاری Google Cloud را بررسی کنید.
لایه پرداخت شده
هنگامی که از محدودیت های استفاده از سطح آزاد فراتر رفتید ، به سطح پرداخت شده منتقل می شوید و انواع مختلفی از ویژگی های تشخیص تصویر با هزینه های مختلف ارائه می شود. قیمت گذاری معمولاً در دو دسته قرار می گیرد:
- قیمت گذاری بر اساس توابع: قیمت بستگی به ویژگی خاصی که استفاده می کنید ، مانند تشخیص برچسب ، پیدا کردن افراد و غیره بستگی دارد.
- قیمت گذاری مبتنی بر حجم: هرچه بیشتر استفاده کنید ، ارزان تر می شود. Google قیمت های کمتری را برای حجم درخواست API بزرگتر ارائه می دهد.
دلایل هزینه
در اینجا برخی از عوامل باید در نظر داشته باشید:
- شماره: اگر از چندین ویژگی مانند تشخیص برچسب ها و تشخیص چهره در همان تصویر استفاده می کنید ، هزینه ها بر اساس تعداد توابع مورد استفاده ضرب می شوند.
- محدودیت سرعت: اطمینان حاصل کنید که محدودیت سرعت را فشار ندهید زیرا این ممکن است عملکرد برنامه شما را مختل کند.
- درخواست های دسته ای: Google Cloud Vision API به شما امکان می دهد درخواست های دسته ای را تهیه کنید که می تواند سودآورتر و مؤثرتر باشد.
- هزینه انتقال داده ها: اگرچه به طور کلی حداقل ، ممکن است هزینه های انتقال داده های اضافی نیز وجود داشته باشد ، به خصوص اگر شما در حال انتقال حجم زیادی از داده ها به خارج از Google Cloud هستید.
برای جلوگیری از هزینه های غیر منتظره ، سیگنال های بودجه را در کنسول Google Cloud خود تنظیم کنید ، بنابراین وقتی هزینه های شما به آستانه خاصی رسید ، به شما اطلاع داده می شود.
مراحل با استفاده از Ayrshare API
جایگزین تر استفاده از Ayrshare API است. با Max Pack بسیاری از برنامه های مفید ، از جمله ژنراتور متن ALT را دریافت می کنید.
مرحله 1: یک حساب در Ayrshare تنظیم کنید
- برای Ayrshare ثبت نام کنید و Max Pack را به حساب خود اضافه کنید.
- کلید API خود را در داشبورد Ayrshare دریافت کنید.
مرحله 2: کد را بنویسید
در اینجا کد تماس نمونه API در node.js. آورده شده است.
const API_KEY = "API_KEY";
fetch("https://api.ayrshare.com/api/generate/altText", {
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": `Bearer ${API_KEY}`
},
body: JSON.stringify({
url: "https://img.ayrshare.com/012/gb.jpg", // required
}),
})
.then((res) => res.json())
.then((json) => console.log(json))
.catch(console.error);
اطمینان حاصل کنید که {api_key} را با کلید API از داشبورد و URL با URL تصویر خود تغییر دهید.
مرحله 3: کد را تکمیل کنید
آن را ذخیره کرده و آن را شروع کنید. اکنون پاسخ با متن Alt تولید شده ، مشابه نمونه زیر را مشاهده خواهید کرد.
{
"status": "success",
"altText": "A ghostbusters vehicle driving through a field.",
"url": "https://img.ayrshare.com/012/gb.jpg"
}
متن alt را از دست ندهید
به طور خودکار تولید کتیبه های تصویر دارای برنامه های مختلفی از جمله بهبود دسترسی به وب سایت ، SEO و تشخیص محتوا است. با استفاده از ابزارهای مدرن AI ، به راحتی می توان این فرآیند را به نفع کاربران و تجارت خود خودکار کرد.


